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Database : 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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RESULT 1 

US-07-807-043B-8 

; Sequence 8, Application US/07807043B 

; Patent No. 5342774 

; GENERAL INFORMATION: 

; APPLICANT: Boon, Thierry, Van den Eynde, Beno t 

TITLE OF INVENTION: Tumor Rejection Antigen Precursors, Tumor 
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TITLE OF INVENTION: Rejection Antigens and Uses Thereof 
NUMBER OF SEQUENCES: 16 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 

STREET: 805 Third Avenue 

CITY: New York City 

STATE: New York 

ZIP : 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM 

OPERATING SYSTEM: PC-DOS 

SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/07/807 , 043B 

FILING DATE: 19911212 

CLASSIFICATION: 424 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/764,364 

FILING DATE: 23-SEPTEMBER-1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/728,838 

FILING DATE: 9-JULY-1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/705,702 

FILING DATE: 23-May-1991 
ATTORNEY /AGENT INFORMATION: 

NAME: Hanson, No. 5342774man D. 

REGISTRATION NUMBER: 30,946 

REFERENCE/DOCKET NUMBER: LUD 253.3 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
; INFORMATION FOR SEQ ID NO: 8: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 5674 base pairs 

TYPE: NUCLEIC ACID 
; STRANDEDNESS : singular 

TOPOLOGY: linear 
MOLECULE TYPE: genomic DNA 
FEATURE : 

NAME/KEY: MAGE-1 gene 
US-07-807-043B-8 

Query Match 100.0%; Score 5674; DB 2; Length 5674; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5674; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I II I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I II I I I 

Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 AT C C AAAC ATC T TC ACGC T C AC C C C CAGCC C AAGC C AGGC AGAATC C G GT T C C ACC C C TG 120 

Qy 121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 C T C T C AAC C C AGGGAAGC C C AGGT GCC C AGAT GTGAC GCC AC T G AC T T GAGC AT T AGT GG 180 

Qy 181 T T AGAGAGAAG C GAGGT T T TCGGT C TGAGGGGC GGC T TGAGATC GGTG GAGGGAAGC GGG 240 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I 

Db 181 T TAGAGAGAAGCGAGGT TTTCGGTC TGAGGGGCGGC T TGAGATC GGTGGAGGGAAGCGGG 240 

Qy 241 C C C AGC T C T GT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC C C AC T T ACC C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 C C C AGC T C T GT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC TGAGGAC C C AC T T ACC C C 300 

Qy 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I 
Db 301 AGAT AGAGGAC C C C AAATAATC C C T TC AT GC C AGT C C T GGAC CATC T GGT GG T GGAC T TC 360 

Qy 361 T C AGGC T GGGC C ACC C C C AGC CCCCTTGCTGC TT AAAC C AC T GGGGAC T C GAAGT C AGAG 420 

I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 361 T C AGGC T GGGC C ACC C C C AGC CCCCTTGCTGC TTAAAC C AC T GGGGAC T C GAAGT C AGAG 420 

Qy 421 C T C C GT GT GAT CAGGGAAGGGC TGC T TAGGAGAGGGC AGC G T C C AGGC T C T GC C AGAC AT 480 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I 
Db 421 C T C C GT GT GAT CAGGGAAGGGC TGC T TAGGAGAGGGC AGC G T C C AGGC T C T G C CAGAC AT 480 

Qy 481 CAT GC T C AGGAT T C T CAAGGAGGGC TGAGGGT CC C T AAGAC C C C AC T C C C GT GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CAT GC TC AGGAT T C T CAAGGAGGGC TGAGGGT CC C T AAGAC C C C AC T C C C GT GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 C C AGGAAAC AT C C GGGTGCC C GGATGT GAC GC CAC T GAC T T GC GC AT T GT GGGGC AGAGA 780 

Qy 781 GAAGC GAGGT T T C C AT TC TGAGGGACGGC GTAGAGT T C GGC C GAAGGAAC C T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGGT T T C CAT T C T GAGGGACGGC GTAGAGT TC GGC C GAAGGAAC C T GAC C C AGG 840 

Qy 841 C T C T GT GAGGAGGC AAGGTGAGAGGC T GAGGGAGGAC T GAGGAC CC C GC C AC T C C AAATA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGAC TGAGGAC CCCGC CAC TCCAAAT A 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9 61 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

Qy 1021 T T C T CC C C AAG C T C T GGAAT C AGAGGT T GC TG TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1021 T TC TC C C C AAGC TC T GGAATC AGAGGT T GC T G T GAC C AGG GC AG GAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 12 60 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCGGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGT T TGC C C C T GC T C T C AACC C AGGGAAGC CC T GGT AGGC C C GAT GT GAAAC C AC T GAC T 1440 

Qy 1441 T GAACC T C AC AGAT C T GAGAGAAG C C AGGT TC AT T T AATGGT T C T GAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1441 T GAACC T C AC AGAT C T GAGAGAAGC C AG GT TC AT T T AATGGT T C T GAGGGGC GGC T T GAG 1500 

Qy 1501 ATC CAC T GAGGGGAGTGGT T T TAGGCTC TGTGAGGAGGCAAGGTGAGATGC TGAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 AT C CAC T GAGG GGAG T GGT T T TAGGC T C T GTGAGGAGGC AAGGT GAGAT GC T GAGG GAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC CC C AGGT AGAT GGC C C CAAAATG AT CC AG T AC CAC C C C T GC T G 1620 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 1561 ACTGAGGAGGCACACACCCCAGGTAGATGGCCCCAAAATGATCCAGTACCACCCCTGCTG 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCC CAGGC ATCAAGGT CCAGCATC CGCC CGGC AT TAGGGT CAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCC CAGGCATCAAGGTCCAGCATC CGCC CGGCAT TAGGGT CAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AC C C TGGGAGGGAAC T GAGGGT T C C CC AC C CAC AC CTGTCTCCT CAT C T C CAC C GC CAC C 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGGTCTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAGAGGGAGGGCCCTAC 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGGTCTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAGAGGGAGGGCCCTAC 2040 
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Qy 2041 TGC GAGATGAGGGAG GCC T C AGAGGAC C C AGC ACC C T AGGAC AC C GC AC C C C TGT C TGAG 2100 

I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 T GC GAGATGAGGGAG GC C T C AGAGGAC C C AGC ACC C T AGGAC AC C GC AC C C C T GTC TGAG 2100 

Qy 2101 AC T GAGGC TGC C AC T TC TGGC C T C AAGAATC AGAACGAT GGGGAC TC AGAT TGC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 1 I I I I I I I 
Db 2101 AC T GAGGC TGC C AC T TC TGGC C T C AAGAATC AGAACGAT GGGGAC TC AGAT TGC AT GGGG 2160 

Qy 2161 GTGGGAC CCAGGCC TGCAAGGC T TACGC GGAGGAAGAGGAGGGAGGAC TC AGGGGACC TT 2220 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2161 GTGGGAC CCAGGCC T GCAAGGC T TACGC GGAGGAAGAGGAGGGAGGAC TC AGGGGACC T T 2220 

Qy 2221 GGAATC C AGAT C AGT G T GG AC C T C GGC C C TGAGAGG T C C AGGGC AC GG T GGC C AC AT AT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAATCC AGAT C AG TGT GGAC C TC GGC C C T GAGAGG TC C AGGGC AC GG T GGC C AC ATAT G 2280 

Qy 2281 GC C CAT AT T TC C T GC AT C T T T GAG GTGAC AGGAC AGAGC TGT GGT C T GAGAAGTGG GGC C 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2281 GC C CAT AT T TC C T GC ATC T T T GAG GTGAC AGGAC AGAGC TGT GGTC T G AGAAGT GG GGC C 2340 

Qy 2341 T C AGGT C AAC AGAGGGAGGAGT T C C AGGAT CC ATAT GGC C C AAGATGT GC C C C C T T C ATG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 T C AGGT C AAC AGAGGGAGGAGT T C C AGGATCC AT AT GGC C C AAGATGT GC C C C C T T C ATG 2400 

Qy 2401 AGGACTGGGGAT AT C C C CGGC T C AGAAAGAAGGGAC T C C AC AC AGT C T GGC TGTCCCCTT 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGGAC T GGGGATAT C C C CGGC T C AGAAAGAAGGGAC T C C AC AC AGT C T GGC TGTCCCCTT 2460 

Qy 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T CAT G T C AG GGAAT T GGGGGT T GAGGAAGC AC AGGC GC T GGC AGGAAT AAAGAT GAGT 2 640 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2581 AC T CAT G T C AGGGAAT T GGGGGT T GAGGAAGC AC AGGC GC TGGC AGGAAT AAAGAT GAGT 2 640 

Qy 2641 GAGAC AG AC AAGGC TAT T GGAATC C AC AC C C C AGAACC AAAGGGGT C AGC C C T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GAGAC AG AC AAGGC TAT T GGAAT C C AC AC C C C AGAAC C AAAGGGGT C AGC CC TGGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

Qy 27 61 CAT T CTC AGAGGGT GAC T C AGGT C AACG T AGG GAC C C C CAT C T GGT C TAAAGAC AGAGC G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 CAT T C T C AGAGGGT GAC TC AGGT C AAC G TAGGGAC C C C CAT C TGGT C TAAAGAC AGAGC G 2820 

Qy 2821 GT C C C AGGAT C TGC CAT GC GTT C GGGTGAGGAAC AT GAGG GAGGAC TG AGGG T AC C C C AG 2880 

1 I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

Qy 2881 GAC C AGAAC AC TGAGGGAG AC TGC AC AGAAAT C AGC C C TGCC C C TGC T GTC AC C CC AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2881 GAC C AGAAC AC TGAGGGAG AC T GC AC AG AAAT C AGC CCTGCCCCTGCT GT C AC C CC AGAG 2940 
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2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 1 I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I 
3001 AC GGGGAGGC C T T GG T C TGAGAAGGC T GCGC T C AGGTC AG T AGAGGGAGCGT C C C AGGC C 3060 

3061 C TGCCAGGAGTCAAGGTGAGGACC AAGC GGGCACC TCACC CAGGACAC ATTAATTC CAAT 3120 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
3061 C TGCCAGGAGTCAAGGTGAGGACC AAGC GGGC ACC TCAC C CAGGACAC ATT AAT TC CAAT 3120 

3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3241 AC C AGC AAAAGGGCAGGAT C C AGGC C C T GC C AGGAAAAAT AT AAGGGC C C T GCGTGAGAA 3300 

3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3301 C AGAGGG GGT C ATC C AC T GCAT GAGAGT GGGGATGT C AC AGAGT C C AGC C C AC C C T CC T G 3360 

3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

3421 CTTCCTGGAGCTCCAGGAACC AGGC AGT GAGGCCTTGGTCTGAG AC AGTATCCTC AGGTC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

3481 AC AGAGC AGAG GAT GC AC AGGGTG T GC C AGC AGT GAATGT T TGC C C TGAATGC AC AC C AA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
34 81 ACAGAGCAGAGGAT GC AC AGGGTG T GC C AGC AGT GAAT G T T TGC C C TGAATG C AC AC C AA 3540 

3541 GGG C CCC AC C T GC C AC AGGAC AC ATAGGAC T C C AC AGAGT C TGG CC TC ACC T C C C T AC T G 3600 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3541 GGGCCC C AC C T GC C AC AGGAC AC AT AGGAC TC C AC AGAG T C T GGC C T C AC C T C C C T AC T G 3600 

3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

3661 C C T T C AGGT T T TC AGGGGAC AGGC C AAC C C AG AGGAC AGG AT TC C C TGGAGGC C AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3661 C C T TC AGGT T T TC AGGGGAC AGGC C AAC C C AG AGGAC AGG AT TC C C T GGAGG C C AC AGAG 3720 

3721 GAGCACCAAGGAGAAGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTC 3780 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3721 GAGC AC C AAGGAGAAGAT C TG TAAGTAGGC C T TTGT TAGAGT C T C C AAGGT T C AGT TC T C 3780 

3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I i I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

3841 CCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAG 3900 
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I I I I I I I i I I I I I I I I I I II t I I I I I I I M I I I I I I I I 11 I I I t I I I I I I I I 1 1 I I I I I I 

Db 3841 CC T GC C C AC AC TCCTGCCTGCTGCCCT GAC GAGAGT CAT CAT GT C TC T T GAGC AGAGGAG 3900 

Qy 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 C AC T GC T GGGT C AAC AGAT CC TC C CCAGAG T C C TC AGGGAGC CTCCGCCTTTCC CAC T AC 4080 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 CAC T GC T GGGT C AAC AGAT C C TCC C CAGAG T C C TC AGGGAGC CTCCGCCTTTCC CAC T AC 4080 

Qy 4081 CAT C AAC T TC AC T C G AC AGAGGC AACC C AGT GAGGG TT C C AGC AGC C GTGAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT C AAC T TC AC T C GAC AG AGGCAACCC AGT GAGGG T T C C AGC AGC C GT GAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 42 60 

Qy 4261 AAT GC T GGAGAGT G T C AT C AAAAAT T AC AAGC AC TGTTTTCCT GAGATC T T C GGCAAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AAT GC T GGAGAGT GT CAT C AAAAAT TAC AAGC AC TGTTTTCCT GAGATC T T C GGCAAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GAT C ATG C C C AAGAC AGGC T T C C T GAT AAT TG T CC T GG TC AT GAT T GC AAT GGAGG GC GG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GAT CATGCCC AAGAC AGGC T TCC T GAT AAT TGTCCTGGTC AT GAT TGCAATGGAGGGCGG 4500 

Qy 4501 CC ATGC T C C T GAGGAGGAAAT C T GGGAGGAGC TGAG TGT GAT GGAGGT GT AT GATGGGAG 4560 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 4501 CC ATGC T C C T GAGGAGGAAAT C T GGGAGGAGC T GAG TGT GAT GGAGGTGT AT GAT GGGAG 4560 

Qy 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4620 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4620 

Qy 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 47 41 GC AAGAG TTCGCTTTTTCT TC CCATCCC T GC G T GAAGC AGC T T T GAGAGAGG AGGAAGAG 4800 

I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
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Db 4741 GC AAGAG TTC G CTTTTTCT TCC C ATC C C TGC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

Qy 4 921 GAAGAGAGC GG T CAGT GT T C TCAGT AGT AGGT TTCTGTTC TAT T GGG T GAC T TGGAGAT T 4 980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 921 GAAGAGAGC GG T C AGT GT T C TC AG T AGT AGGT TTCTGTTC TAT T GGG T GAC T TGGAGAT T 4 980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTC AGC ATC C AAG T T TAT GAATGAC AGC AGT C AC AC AGT T C T GT GTAT ATAG T T T AAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

Qy 5161 AAC AGC AGT GGAAT AAG TACT TAG AAAT GTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AGT GGAAT AAG TAC T TAG AAAT GT GAAAAAT GAGC AGT AAAATAGATGAGAT AA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AAT T C T T GC C T TAT AC C T C AGT C TAT TC T G TAAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AAT T C T T GC C T TAT AC C T C AGT C TAT TC TG T AAA 5280 

Qy 5281 AT T T T T AAAGAT AT AT GC AT AC C T GGAT TTC C T T GGC T T C T T T G AGAAT GTAAGAGAAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I 
Db 5281 AT T T T T AAAGAT AT AT GC AT AC C T GGAT T TC C T T GGC T T C T T T GAGAAT GTAAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 01 TCTGCTTTT T GGAAGGC C C T GGG T T AGT AGT GGAGAT GC T AAGG TAAG C C AGAC T CAT AC 54 60 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C TAAAGAT G T AGGGAAAAGTGAGAGAGGGG T GAGGGT G T GGGGC TCC GGG TGAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C T C TAAAGAT G T AGG GAAAAGTGAGAGAGGGG T GAGGG T G T GGGGC TCC GGG TGAG AG T G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCT GAT TGTAATGATCTT GGG T GGAT CC 567 4 
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RESULT 2 

US-08-190-411A-1 

Sequence 1, Application US/08190411A 
Patent No. 5541104 
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MOLECULE TYPE: genomic DNA 
FEATURE : 

NAME /KEY : MAGE-1 gene 
US-08-190-411A-1 

Query Match 100.0%; Score 5674; DB 2; Length 5674; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 567 4; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 C T C TC AAC C C AGGGAAGC C C AGGT GC C C AGAT GTGAC GCC AC T GAC T T GAGC AT T AGT GG 180 

I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 121 C T C TC AAC C C AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC T GAC T T GAGC AT T AGT GG 180 

Qy 181 T TAGAGAGAAGCGAGGTT T TC GGTC TGAGGGGCGGC T TGAGATC GGTGGAGGGAAGCGGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 T TAGAGAGAAGCGAGGTT T TC GGTC TGAGGGGCGGC T TGAGATC GGTGGAGGGAAGC GGG 240 

Qy 241 C C C AGC T C T GT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGACC C AC T T AC C C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 C C C AGC T C T GT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGACC C AC T T AC C C C 300 

Qy 301 AGAT AGAGGAC C C CAAAT AATC C C T T CAT GC C AGT C C T GGAC CAT C T G GT GGT GGAC T T C 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AGAT AGAGGAC C C CAAAT AATC C C T T CAT GC C AGT C C T GGAC C ATC T G GT GG TGGAC T T C 360 

Qy 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CAT GC TC AGGAT T C T C AAGGAGGGC T GAGGGT C C C T AAGAC CC C AC TC CC GT GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CAT GC T C AGGAT T C T C AAG GAGGGC T GAGGGT C C C T AAGAC C C C AC TC CC GT GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 C C AGGAAAC AT C C GGG T GC CC GGATGT G AC GC C AC T GAC T TGC GC AT T G TGGGGC AGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 C C AGGAAAC AT C C GGGT GC CC GGAT GT GAC GC C AC T GAC T TGC GC AT T GT GGGGC AGAGA 780 
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Qy 781 GAAGC GAGG T T T C CAT T C T GAGGGACGGC G TAGAGT T C GGC C GAAGGAAC C TGAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GAAGC GAGGT T T C CAT T C T GAGGGACGGC GTAGAGT TC GGC C GAAGGAAC C TGAC C C AGG 840 

Qy 841 C T C TGTGAGGAGGC AAGGT GAGAGGCTG AGGGAGGAC T GAGGAC C CC GCC AC TCC AAAT A 900 

I M I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I II I II 

Db 841 C TC TGTGAGGAGGC AAGGTGAGAGGCTGAGGGAGGAC TGAGGAC CCCGCCAC TCCAAATA 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 G AG AGC C C C AAAT AT T C C AGC CCCGCCCTTGCTGCC AGC C C T GG C C C AC C C GC GGG AAGA 960 

Qy 961 C GT C TC AGC C T GGGC T GC C CC C AGACC C C TGC T C C AAAAGC C T T GAGAGAC AC C AGGT T C 1020 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 C GT C TC AGC C T GGGC T GC C CC C AGACC C C TGC TC CAAAAGC C T T GAGAGAC AC C AGGT T C 1020 

Qy 1021 T TC T C C C C AAGC T C T GGAATC AGAGGT T GC TGTGAC C AGGGC AG GAC T GGT T AGGAGAGG 1080 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1021 T T C T C C C C AAG C T C T GGAATC AGAGGT T GC T G TGAC C AGGGC AG GAC T GGT T AGGAGAGG 1080 

Qy 1081 GC AGGGC AC AGGC T C T GC C AGGC AT C AAGAT C AGC AC C C AAGAG GGAGGGC T G T GG GC C C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 12 60 

I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1381 GGT TTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGT AGGC CCGATGTGAAACC AC TGAC T 1440 

Qy 1441 T GAAC C T C AC AGATC T GAG AGAAGC C AG GT TC AT T T AAT G GT T C T GAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 T GAAC C T C AC AGATC T GAG AGAAGC C AG GT TC AT T T AATGGT TC T GAGGGGC GGCT T GAG 1500 

Qy 1501 ATC C AC T GAGGGGAG T GG T T T T AGGC TC T GTG AGGAGGC AAGG T GAGATGC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 1501 ATC C AC T GAGGGGAG TGGT T T TAGGC T C T GT GAGGAGGC AAGGT GAGATGC TGAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT G ATC C AGTAC C AC C C CT GC TG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT C C AGTAC C AC C C CT GCT G 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I II I I I I I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AC C C TGGGAGGGAAC T GAGGGT T C C CC AC C C AC AC CTGTCTCCT CAT C T C C AC C GC C ACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 T C AAC C C AC GGAAGC C AC G GGAATGGC GGC C AGGCAC T C GGATC T T GAC GT C C C C ATC C A 1980 

I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGGTC TGATGGAGGGAAGGGGC T TGAAC AGGGC C TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I 
Db 1981 GGGTC TGATGGAGGGAAGGGGC T TGAAC AGGGC C TC AGGGGAGC AGAGGGAGGGCC CT AC 2040 

Qy 2041 T GC GAGATGAGGGAGGC C T C AGAGGAC C C AGC AC C C T AGGACAC C GC AC C C C T GT C TGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 T GC GAGATGAG GGAGGC C T C AGAGGAC C C AGC AC C C T AGGACAC C GC AC C C C T GTC TGAG 2100 

Qy 2101 AC T GAGGC T GC C AC T TC TGGC C T C AAGAATC AGAAC GAT GGGGAC TCAGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC T GAGGC T GC C AC T TC T GGC C T C AAGAATC AGAAC GAT G GGGAC TCAGAT T GC AT GGGG 2160 

Qy 2161 GT GGGAC C C AGGC C T GC AAGGC T T ACGC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GT GGGAC C C AG GC C T GC AAGGC T T ACGC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

Qy 2221 GGAAT C C AGAT C AGT GT GGAC C T C GGC C C TGAGAGG T C C AGGGC AC GGT GGC C AC AT AT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TC AGGTC AAC AGAGGGAGGAGT T C C AGGATC C AT AT GGC C CAAGATGT GC C C C C T T C ATG 2 400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 TC AGGT C AAC AGAGGGAGGAGT T C C AGGATC CAT AT GGC C C AAGATG T GC C C C C T T C ATG 2 400 

Qy 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

Qy 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2 580 

Qy 2581 ACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCAGGAATAAAGATGAGT 2640 

I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
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Db 2581 AC T C ATG TC AGGGAAT TGGGGGT T GAGGAAGC AC AGGC GC TGGC AGGAATAAAGAT GAGT 2 640 

Qy 2641 GAGACAGACAAGGCTATTGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACACC 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GAGAC AGAC AAGGC T AT T GGAAT C C AC AC CC C AGAAC C AAAGGGGTC AGC C C TGGACAC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 1 I I I I I I I I I II I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I II I I I I I I I M I II I I I I I I I I I I I I 
Db 27 61 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GT C CC AGGAT C TGCC ATGC GT TC GGGT GAGGAAC AT GAGGGAGGAC TGAGGGTAC C C C AG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

Qy 2881 GAC C AGAAC AC T GAG GGAGAC T GC AC AGAAAT C AGC CCTGCCCCT GC T GTC AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GAC C AGAAC AC T GAGGGAGAC T GC AC AGAAAT C AGC CCTGCCCCT GCT GTC AC C CC AGAG 2940 

Qy 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C TGCCAGGAGT CAAGGTGAGGACC AAGC GGGC AC C T CACCCAGGAC AC AT TAAT TC CAAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 C TGCCAGGAGT CAAGGTGAGGACC AAGC GGGC AC C T CACCCAGGAC AC AT TAAT TC CAAT 3120 

Qy 3121 GAAT T T T GATAT CTCTTGCTGCCCTTCCC C AAGGAC C TAGGC AC GTGT GGC C AGAT G T T T 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 AC C AGC AAAAGGGC AGGAT CCAGGC C C T GC C AGGAAAAAT AT AAGGGC CC TGC GTGAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 AC C AGC AAAAGGGC AGGAT CCAGGC CC T GC C AGGAAAAAT AT AAGGGC C C T GC GTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 C T T C C TGGAGC T C C AGGAAC C AGGC AG T GAGGC C T T GGT C T GAGAC AG T ATC C T C AGGTC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 C T T C C T GGAGC TC C AGGAAC C AGGC AGT GAGG C C T T GG TC T GAG AC AG TAT C C T C AGGT C 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 
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Qy 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 3541 GGGC C C C ACC T GC C AC AGGAC AC AT AGGAC TC C AC AGAGT C TGGC C TCACCTCCC T AC TG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

j I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II i I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T TCAGGTT T TCAGGGGACAGGC CAAC CCAGAGGACAGGAT TC CC TGGAGGCCAC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 3661 CC T TCAGGTTT TCAGGGGACAGGC CAAC CCAGAGGACAGGATTC CC TGGAGGCCAC AGAG 3720 

Qy 3721 GAGC AC C AAGGAGAAGAT C T GT AAG T AGGC C T T TGT T AGAGT C T CC AAGGT T CAGT T C T C 3780 

I I IE I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3721 GAGC AC C AAGGAGAAGAT C T GTAAGT AGGC C T T TGT T AGAGT C T CC AAGGT T C AG T T C TC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I ! I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 CC T GC C C AC AC TC C T GCC T GC T GC C C T GAC GAGAGT C AT C AT GT C TC T T GAG C AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 CC T GC C C AC AC TC C T GC C T GC T GC C C TGAC GAGAG T CAT C ATGT C T C T T GAGC AGAGGAG 3900 

Qy 3901 TC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC CC AAC AAGAGGCC C T GGGC C T GGT G TG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 TC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC CC AAC AAGAGGCC C T GGGC C TGG TGT G 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4 080 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I II I 1 I I I I I I I I I I I 
Db 4021 C AC TGC T GGGT C AAC AGAT C C T CC C C AGAGTC C T C AGGGAGC C T C C GC C T T T C C C AC T AC 4080 

Qy 4081 CAT CAAC T T C AC TC GAC AG AGGC AAC C CAGT GAGGG T T C C AGC AGC C GT GAAGAGG AGGG 4140 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT CAAC T T C AC T C GAC AGAGGCAACC CAGTG AGGG T T C C AGC AGC C G T GAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 T GAT TTGGT TGGT TTTC TGC TCCTCAAATATC GAGC C AGGGAGC CAGTC AC AAAGGCAGA 4260 

I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I II I I I ! I I I I I I I I I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 42 60 

Qy 42 61 AATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I 
Db 4261 AAT GC T GGAGAGT GT C ATC AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T TC GGC AAAGC 4320 

Qy 4321 C T C T GAGT C C T T GC AGC TGGTC T T T GGC AT T GAC GT GAAGGAAGC AGACC CC AC C GGC C A 4380 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4321 CTCTGAGTCCT TGC AGC TGGTC TT TGGC AT TGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I M 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 444 0 
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Qy 4 441 GAT C AT GC C C AAGAC AGGC T TC C T GATAAT T G TC C T GG TC ATGATTGC AAT GGAGG GCGG 4 500 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I 
Db 4 441 GAT C AT GCC C AAGAC AGGC T TC C T GATAAT T G TC C T GG TC ATGATTGC AAT GGAGGGCGG 4500 

Qy 4501 C CAT GC T CC T GAGGAGGAAATC TGGGAG GAGC TGAG TGTGATGGAGGT GT AT GAT G GGAG 4560 

I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4501 C CAT GC T C C TGAGGAGGAAATC TGGGAGGAGC TGAG TG TGATGGAGGT GTAT GAT GGGAG 4560 

Qy 4 561 GGAGC AC AGT GCC TAT GGGGAGC C C AGGAAGC TGC T C ACC C AAGAT T T GGT GC AGGAAAA 4 620 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4561 GGAGCAC AGTGCC TAT GGGGAGC C C AGGAAGC TGC T C ACC C AAGAT TT GGT GC AGGAAAA 4620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4681 C C AAGGGC C C T C GC T GAAACCAGC TAT G T GAAAG T C C T T GAGTATGT GAT C AAGGT C AGT 4740 

Qy 4741 GC AAGAGT T CGCTTTTTCT TCCCAT C C C T GC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCT T CCC AT C C C TGC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4 921 GAAGAGAGC GG TC AG T GT T C TC AG TAGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4 980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 921 GAAGAGAGC GG T C AG T G T T C TC AG TAGT AGGT TTCTGTTC TAT T GGG T GAC T T GGAGAT T 4 980 

Qy 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 T TC AGC AT C C AAGT T TAT GAAT GAC AGC AGT C AC AC AGT T C T GT GTAT AT AG T T TAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 T AAGAGTC T T G T G T T T TAT TC AGAT T GGGAAATC C AT T C TAT T T TGT GAAT T GGGAT AAT 5160 

Qy 5161 AACAGCAGTGGAATAAGTACTTAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AACAGCAGTGGAATAAGTACTTAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGATAG TC AAT T C T TGC C T TAT ACC T C AGT C TAT TC T G T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAGATAG T C AAT TCTTGCCT TAT AC C T C AGT C TAT T C TGT AAA 5280 

Qy 5281 AT T T T TAAAGATAT ATGC ATAC C T GGAT T TC C T T GGC TT C T T T GAGAATGT AAGAG AAAT 5340 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T TAAAGATAT AT GC AT AC C T GGAT T T C C T T GGC T T C T T TG AGAAT GT AAGAG AAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 

Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C TC TAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGC TC CGGGTGAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTC CGGGTGAGAGTG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I III I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGC T GAT T GT AAT GAT C T T GGGT GGAT C C 5 674 
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; INFORMATION FOR SEQ ID NO: 8: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 5674 base pairs 

TYPE: nucleic acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
MOLECULE TYPE: genomic DNA 
FEATURE : 

NAME /KEY : MAGE-1 gene 
US-08-299-849B-8 

Query Match 100.0%; Score 5674; DB 2; Length 5674; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5674; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I i I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I 
1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I M I I I 
61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

121 C TC T C AACC C AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC T GAC T T GAGC AT TAG T GG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 C T C TC AAC C C AGGGAAGC C CAGGT GC C C AGAT GTGAC GC C AC T GAC T T GAGC AT T AGTGG 180 

181 T T AGAGAGAAGC GAGGT T T T C GGT C TGAGGGGC GGC T TGAGAT C GG T GGAGG GAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 T T AGAGAGAAGC GAGGT TTTCGGTCT GAGGGGC GGC T T GAG AT C GGTGGAGGGAAGC GGG 240 

241 C C C AGC T C TGT AAGGAGGC AAGG T GAC AT GC T GAGG GAGG AC T GAGGAC C C AC T TAC C CC 300 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
241 C C C AGC T C T GT AAGGAGGC AAGGT GAC ATGC T GAGGGAGGAC T GAGGAC C C AC T TAC C CC 300 

301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I LI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
421 C T C C GT GT GAT C AGGGAAGGGC TG C TTAGGAGAGGGC AGC GT C C AGGC TC TGC C AG AC AT 480 
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Qy 481 CAT GC TC AGGAT T C T C AAGGAGGGC TGAGGGT C CC T AAGAC CC C AC TC C C GT GAC C C AAC 540 

I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I 1 I I 

Db 481 CAT GC TC AGGAT T C TC AAGGAGGGC TGAGGGT C CC T AAGAC CC C AC TC C C GT GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I M I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I 

Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CC AGGAAAC AT C C GGGTGC C C GGATGTGAC GC C AC T GAC T TGC G CAT T GT GGGGC AGAGA 780 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I 

Db 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

Qy 781 GAAGC GAGGT T TC C AT TC T GAGGGACGGC GTAGAGT TC GGC C GAAGGAAC C T GAC CC AGG 840 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db ■ 781 GAAGC GAGGT T TC C AT T C T GAGGGACGGC GTAGAGT TC GGCC GAAGGAAC C T GAC C C AGG 840 

Qy 841 C TC TGTGAGGAGGCAAGGT GAGAGGCTGAGGGAGGAC TGAGGAC CCCGCCAC TC CAAATA 900 

I I I I I I I I I I I I I II I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 102 0 

Qy 1021 T T C TC C C C AAGC TC T GGAAT C AGAGGT T GC T G T GAC C AGGGC AG GAC T GGT T AGGAGAGG 1080 

I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 T T C TC C C C AAGC T C T GGAAT CAGAGGT T GC T G TGAC C AGGGC AG GAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I 

Db 1081 GC AGGGC AC AG GC T C T GC C AGGC AT C AAGAT C AGC AC C C AAGAGGGAGGGC T GT GG GC CC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGT TTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGT AGGC CCGATGTGAAACC ACT GAC T 1440 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 

Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 14 40 

Qy 1441 TGAAC C T C AC AGATC T GAGAGAAGC C AG GT T C AT T T AATGGT TC TGAGGGGC GGC T T GAG 1500 

I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I M M I I M M I I I I I I I 

Db 14 41 TGAAC C T C AC AGATC T GAGAGAAGC CAGGT T C AT T T AATGGT TC TGAGGGGC GGC T T GAG 1500 

Qy 1501 ATC C AC T GAGGGGAGT GGT T T T AGGC T C T GT G AGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 ATC C AC TGAGGGGAGTGGT T TTAGGC TC TGTGAGGAGGCAAGGT GAGAT GC T GAGGGAGG 1560 

Qy 1561 AC T GAGG AGGC AC AC ACC C C AGGT AGAT GGC C C C AAAATG ATC C AG TAC C AC CC C TGC T G 1620 

I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AC T GAGG AGGC AC AC ACC C CAGGT AGAT GGC C C C AAAAT GATC C AG TAC C AC C C C TGC T G 1620 

Qy 1621 CC AGC C C T GGAC C AC C C GGC C AGGAC AGAT GT C TC AGC T GGAC C AC CCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I II I I I I I I I I I I II i I IE I ii I I I I I I I I I I II I I II I i I II I i I I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 AC C C T GGGAGGGAAC TGAGGGT TC C C C AC C C AC AC CTGTCTCCT CAT C T C C AC C GC C AC C 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AC C C T GGGAGGGAAC TGAGGGT TC C C C AC C C AC AC CTGTCTCCT CAT C T C C AC C GC C AC C 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I ! I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG T C T GAT GGAGGGAAGGGGC T T GAAC AGGGC C TC AGGGGAGC AGAGGGAG GGC C C TAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGGTCTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAGAGGGAGGGCCCTAC 2040 

Qy 2041 TGC GAGATGAGGGAGGCC T CAGAGGACC C AGC ACCC TAGGACAC CGCACCCC TGTC T GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 TGC GAGAT GAGGGAGGCC T C AGAGGAC C C AGC AC C C T AGGAC AC CGC AC CCCTGTCT GAG 2100 

Qy 2101 AC T GAGGC T GC C AC T T C TGGCC TC AAGAAT C AGAAC GAT GGGGAC T CAGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2101 AC T GAGGC T GC C AC TTCTGGCC TC AAGAAT C AGAAC GAT GGGGAC T CAGAT T GC AT GGGG 2160 

Qy 2161 GT GGGAC C C AGGC C T GC AAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC T CAGGGGAC C T T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GTGGGAC CC AGGC C T GC AAGGC T T ACGC GGAGGAAGAGGAGGGAGGAC TC AG GGGAC C T T 2220 

Qy 2221 GGAAT C CAGAT C AG T GT GGAC C TC GGC C C TGAGAGG TC C AGGGC AC GGT GGC C AC AT ATG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAAT C CAGAT C AGTGT GGACC TC GGC C C T GAGAGG TC C AGGGC AC GG T GGC C AC AT ATG 2280 

Qy 2281 GC C CAT AT T T C C TGC ATC T T T GAGG TGAC AGGAC AG AGC T GTGG TC TGAGAAG TGG GGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 T C AGGT C AAC AGAGGGAGGAGT TC C AGGAT C CAT AT GGC C C AAGATGT GC C C C C TT C ATG 2400 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 T C AGG T C AAC AGAGGGAGGAG T TC C AGGATC C AT AT GGC C C AAG AT GT GC C C C C TT C AT G 2400 

Qy 2401 AGGAC TGGGGAT AT C C C C G GC T C AGAAAGAAGGGAC T C C AC AC AG T C T GGC TGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I M II M I I I I I I I I 
Db 2401 AGG AC TGGGGAT ATCCCCGGCTCAGAAAGAAGGGACTCC AC AC AGTCT GGC TGTCCCCTT 2460 

Qy 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2 521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T CAT G T C AGGGAAT T GGGGGT T GAGG AAGC AC AG GC GC TGGC AGGAAT AAAGAT GAGT 2 64 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AC T C ATGTC AGGGAAT TGGGGGTT GAGGAAGC AC AGGCGC TGGC AGGAAT AAAGAT GAGT 2 64 0 

Qy 2 641 GAG AC AGAC AAGGC TAT TG GAATC C AC AC CC C AGAAC C AAAGGGGTC AGCC C T GGAC AC C 2 700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2 641 GAGAC AGAC AAGGC TAT TG GAATC C AC AC C C C AGAAC C AAAGGGGTC AGC C C T GGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 2761 CAT T C TC AGAGGG T GAC T C AGGTC AAC G T AGGGAC C C C CAT C T G GTC T AAAGAC AGAGC G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 CAT T C TC AGAGGG T GAC T C AGG TC AAC G T AGGGAC C C C C AT C TG G TC T AAAGAC AG AGC G 2820 

Qy 2821 GTC C C AGGAT C TGC C ATGC G T TCG GGT GAGGAAC AT GAGG GAGGAC T GAGGGT AC C C C AG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I 
Db 2821 GT C C C AGGAT C T GC CAT GC G T TCGGGT GAGGAAC AT GAGGGAGGAC T GAGGG T AC C C C AG 2880 

Qy 2881 GAC C AGAAC AC T GAG GGAGAC TGC AC AGAAAT C AGC CCTGCCCCTGCT GT C AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GAC C AGAAC AC T GAG GGAGAC TGC AC AGAAAT C AGC CCTGCCCC TGC T GT C AC C C C AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 AC GGGGAGGC CTTGGTCT GAGAAGGC T GC GC T CAGG TC AG T AGAGGGAGC GT C C C AGGC C 3060 

Qy 3061 C T G C C AG GAG T C AAG GTGAGGACC AAGC GGGC AC C T C AC C CAGG AC AC AT T AAT T C C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 C T G C C AG GAG T C AAG GTGAGGACC AAGC GGGC AC C T C AC C CAGG AC AC AT T AAT T C C AAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy -3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 
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Qy 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

I I I E I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 33 60 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3421 C T T C C T G GAGC TC C AGGAAC C AGGC AGT GAGGC C T T GG T C TGAGAC AG TAT C C TC AGGT C 3480 

Qy 3481 AC AGAGC AGAG GATGC AC AGGGT G T GC C AGCAGTGAATG T T T GC C C T GAAT G C AC AC C AA 3540 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC TTC AGGT TT TCAGGGGAC AGGC CAACCCAGAGGAC AGGATTCCCTGGAGGCC AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3661 CC T T C AG GT T T T C AGGGGAC AGGC C AAC C C AGAGGAC AGGAT T C C C T G GAGG C C AC AGAG 3720 

Qy 3721 GAGCACCAAGGAGAAGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTC 3780 

I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3721 GAGC AC C AAGG AGAAGAT C T GT AAGTAGGC C T T T G T T AGAG T C T C C AAGGT T C AG T T C T C 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C C AC AC TCCTGCCTGCTGCCC TGACGAGAGT CATC AT GT C T C T T GAGC AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 3841 C C T GC C C AC AC T C C T GC C T GC T GC C C T GACGAGAGT CAT CAT GT C T C T T GAGC AGAGGAG 3900 

Qy 3901 TC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGG C C C T GGGC C T GG T G T G 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I II II I I I I I I i I I I I 

Db 3901 TC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGGC C C T GGGC C T GG T G T G 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

Qy 4 081 CATC AAC TTC AC TCG AC AG AGGC AACCCAGTG AGGGT TCC AGC AGC CGTGAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4081 CAT C AAC T T C AC T C G AC AG AGGC AAC C C AG T GAGGG T TC C AGC AGC C G T GAAGAGGAGGG 4140 
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Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I II I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II M I I I I I I I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AAT GC T GGAGAG TGT C ATC AAAAAT TAC AAGC ACTGTTTTCCT GAGAT C T T C GGC AAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 61 AAT GC T GGAGAG TGT CAT C AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T TC GGC AAAGC 4320 

Qy 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GAT CAT GC C C AAGAC AGGC T T C C T GAT AAT T G T C C T GGTC AT GAT TGC AAT GGAGGGC GG 4 500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GAT CAT GC C C AAGAC AGGC T T C C T GAT AAT TG T C C T GGTC AT GAT TGC AAT G GAGGGC GG 4500 

Qy 4501 C C ATGC T C C TGAGGAGGAAATC T G GGAGGAGC TGAG TGTGAT GGAGGT GT AT GAT GGGAG 4 560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4501 C C ATGC T C C T GAGGAGGAAAT C T G GGAG GAGC TGAG TGT GAT GGAGGT G TAT GAT GGGAG 4560 

Qy 45 61 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 5 61 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4621 GT ACC T GGAGT AC GGC AGG T GC C GGAC AGT GAT CC C GC AC GC TAT GAGT T C C T GT G GGGT 4 680 

Qy 4681 C C AAGGGC C C T C GC T GAAAC C AGC TAT G T GAAAGT C C T T GAG TAT GT GAT C AAGGTC AGT 4740 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 4 681 C C AAGGGC C C T C GC T GAAAC C AGC TAT G T GAAAGT C C T T GAG TAT G T GAT C AAGGTC AGT 4740 

Qy 4741 GC AAGAGT T CGCTTTTTCTTCC C ATC C C T GC G T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAGT T CGCTTTTTCTTCC C ATC C C T GC G T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGT CTGAGC AT GAGT TGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCC AG TGCACCTT 4860 

Qy 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4921 GAAGAGAGC GG T C AG T GT T C TC AG T AGT AGGT T TC T GT T C TAT T GGGTGAC T T GGAGATT 4980 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4921 GAAGAGAGC GG TC AGTGT T C TC AG T AGT AGGT T T C T GT T C TAT T GGGTGAC T T GGAGATT 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 504 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 
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II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 5041 T T C AGC AT C C AAGT T TAT GAAT GAC AGC AGTC AC AC AGT TC TGT GTAT AT AG T T T AAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

Qy 5161 AAC AGCAGTGGAATAAGTAC T TAGAAATGTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGCAGTGGAATAAGTAC T TAGAAATGTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

Qy 5221 AGAAC TAAAGAAAT T AAGAGATAG TC AAT TC T T GC C T TAT AC C T C AGT C TAT T C T G TAAA 5280 

I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC TAAAGAAAT T AAGAGATAG TC AAT T C T T GC C T TAT AC C T C AGT C TAT T C T G TAAA 5280 

Qy 5281 AT T T T T AAAGAT AT AT GC AT AC C T GGAT T T C C T T GGC T T C T T TG AGAATGT AAGAG AAAT 5340 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I i II I I I 
Db 5281 AT T T T T AAAGATAT AT GC AT AC C T GGAT T T C C T TGGC TT C T T TGAGAATG T AAGAG AAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TC T GC T T T T T GGAAG GC C C T GGGT T AGT AG T GGAGAT GC T AAGG T AAGC C AGAC T CAT AC 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C TAAAGAT G TAGG GAAAAGTGAGAGAGGGG T GAGGGT GT GGGGC T C C GGG T GAG AGT G 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C T C TAAAGAT G TAGG GAAAAG TGAGAGAGGGG T GAGGGT GT GGGGC T C C GGG T GAG AGT G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAG C T GAT T GT AAT GAT C T T GGGT GGAT C C 5674 
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Query Match 100.0%; Score 5674; DB 2; Length 5674; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5674; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I i i I I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 


Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I i I I I I 
Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 
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11 

Qy 121 C T C T C AAC C C AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC T GAC T T GAGC AT T AGT GG 180 

I I I t I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 C TC TC AAC C C AGGGAAGC C C AGGT GC C C AGATG T GAC GC C AC TG AC T T GAGC ATT AGT GG 180 

Qy 181 T TAGAGAGAAGC GAGGT T T TC GGT C TGAGGGGCGGC T T GAGAT C GGT G GAGGGAAG C GGG 240 

I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 

Db 181 TTAGAGAGAAGCGAGGTTT TCGGT C TGAGGGGCGGC TTGAGATCGGTGGAGGGAAGCGGG 240 

Qy 241 C C C AGC T C TGT AAGGAGGC AAGGT GAC ATGC T GAGGGAGG AC TGAGGAC C C AC T T AC C C C 300 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 C C C AGC T C T GT AAGGAGGC AAGGT GAC ATGC T GAGGGAGG AC TGAGGAC C C AC T TAC C C C 300 

Qy 301 AGAT AGAGGAC C C C AAAT AATC C C T T CATGC C AGTC C T GGAC CAT C TGGTGG T GGAC T T C 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

Qy 361 TC AGGC T GGGC C AC C C C C AGC CCCCTTGCTGCT T AAAC C AC TGG GGAC T C GAAGT C AGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TC AGGCT GGGC CACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTC AGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 4 81 CAT GC T C AGGAT TC T C AAG GAGGGC T GAGGGT C C C T AAGAC C C C AC T C C C GT GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CAT GC TC AGGAT TC T C AAG GAGGGC T GAGGGT C C C T AAGAC C C C AC T C C C GT GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

Qy 781 GAAGC GAGGT T T C CAT T C T GAGGGACGGC G T AGAG T TC GGC C GAAGGAAC C T GAC C C AGG 840 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGGT T TC C AT T C T GAGGGACGGC GT AGAG T TC GGC C GAAGGAAC C T GAC C C AGG 840 

Qy 841 C T C TGT GAGGAGGC AAGGT GAGAG GC TGAGGGAGGAC T GAGGAC C C C GC C AC T C C AAAT A 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 C T C TGT GAGGAGGC AAGGT GAGAG GC TGAGGGAGGAC T GAGGAC C C C GC C AC T C C AAAT A 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

Qy 1021 T T C TC C C C AAGC TC T GGAAT C AG AGGT T GC T G TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 


http://es/ScoreAccessWeb/GetItem .action? Appld=088 1 9669&seqld=6095 1 8&ItemName=us. . . 8/30/06 


1 1 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1021 T T C T C C C C AAGC TC T GGAATC AGAGGT T GC TG TGAC CAGGGC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I E I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGT T TGC C CC T GC T C T C AAC C C AGGGAAGC C C T GGT AGGC C C GAT G T GAAAC C AC T GAC T 1440 

I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 14 41 TGAAC C T C AC AGAT C T GAGAGAAGC C AG G T T CAT T T AAT GGT TC T GAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I E I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TGAACCTCACAGATC TGAGAGAAGCCAGGTTCATTTAATGGTTC TGAGGGGCGGC T TGAG 1500 

Qy 1501 AT C C AC T GAGGGGAG TGGT T T TAGGC T C T G T GAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I 
Db 1501 ATC C AC T GAGGGGAG T GGT T T T AG GC T C T GTGAGGAGGC AAGG T GAGAT GC T GAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT C C AGTAC C AC CCCTGCTG 1620 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | I I I I 
Db 1561 AC T GAGGAGGC AC AC AC C C CAGG T AGAT GGC C C C AAAAT GAT C C AGTAC C AC C C C T GC TG 1620 

Qy 1621 C C AGC C C TGGAC C AC C C GGC C AGGAC AGAT GTC TC AGC T GGAC C AC CCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGT CAGGAGAGGCAGGGCCC AGGC ATC AAGGT CC AGC ATC CGCCCGGC AT TAGGGT CAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAAT CCCTGCTG 1920 

I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAAT CCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGGTC TGATGGAGGGAAGGGGC TT GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

I I I I I I I I i I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I 
Db 1981 GGGTC TGATGGAGGGAAGGGGC TT GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

Qy 2041 TGCGAGAT GAGGGAGGC C T C AGAGGAC C C AGC AC C C T AGG AC AC CGC AC CCCTGTCT GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2041 T GC GAGAT GAGGGAGGC C T C AGAGGAC C C AGC AC C C T AGG AC AC C GC AC CCCTGTCT GAG 2100 

Qy 2101 AC TGAGGC TGC C AC T TC T GGC C TC AAGAAT CAGAAC GATGGGGAC TC AGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2101 AC TGAGGC TGC C AC T TC TGGC C TC AAGAAT CAGAAC GAT GGGGAC TC AGAT T GC AT GGGG 2160 

Qy 2161 GTGGGAC CCAGGCC TGCAAGGC TT ACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGACCTT 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2161 GTGGGAC CCAGGCC TGCAAGGC TTACGC GGAGGAAGAGGAGGGAGGAC TC AGGGGACCT T 2220 

Qy 2221 GGAATC C AGAT C AGT GTGGAC C TC GGC C C T GAGAGG T C C AGGGC AC GG TGGC C AC AT AT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAAT C C AGAT C AGT GTGGAC C TC GGC C C T GAGAGG T C C AGGGC ACGG TGGC C AC AT AT G 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCC ATAT T TC C TGC ATC T T TGAGGTGAC AGGAC AGAGC T GTGGTC TGAGAAGTGGGGCC 2340 

Qy 2341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I i I I 
Db 2341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

Qy 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I 
Db 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

Qy 2 4 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2 521 C AGGC AGGAAG T T GGGGGGC C C T C AGGG AGAT GGGG T C T T GGGG T AAAGGGGGGAT G T C T 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2 581 ACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCAGGAATAAAGATGAGT 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 581 ACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCAGGAATAAAGATGAGT 2 640 

Qy 2 641 GAGAC AGAC AAGGC TAT T GGAATC C AC AC C C C AGAAC C AAAGGGGTC AGC C C T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 641 GAGAC AGAC AAGGC TAT TGGAATC C AC AC C C C AGAAC C AAAGGGGTC AGC C C TGGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 27 61 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GT C C C AGGATC T GC C AT GC G T T CG GGT GAGGAAC AT GAGGGAGGAC TGAGGGT AC C C C AG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 GT C C C AGGATC TGCCATGCGTTCGGGT GAGGAAC AT GAGGGAGGAC TGAGGG TAC C C C AG 2880 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


2881 GAC C AGAAC AC T GAGGGAGAC T GC AC AGAAAT C AGC CCTGCCCC TGC TG T C AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2881 GACC AGAAC AC TGAGGGAG AC TGC AC AG AAATC AGC CCTGCCCC TGC TGTCACCCC AGAG 2940 

2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

3061 C T GCC AGGAGT C AAGGT GAGGACC AAGC GGGC ACC T C AC C C AGG AC AC AT T AAT TC C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3061 C TGCCAGGAGTCAAGGTGAGGACC AAGC GGGCACC T CACC CAGGAC AC ATTAAT TCC AAT 3120 

3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3121 GAATT T T GATATC TCTTGCTGCCCTTCCC C AAGGAC C T AGGC AC GTGT GGC C AGAT GT T T 3180 

3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

3361 GT AGC AC T GAG AAGC C AGGGC T GT GC T T GC GG T C T G C AC C C T GAGGGC C C GT GGAT TC C T 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3361 GT AGC AC T GAG AAGC C AGGGC T G T GC T T GCGG T C T GC AC C C T GAGGGC C C GT GGAT TC C T 3420 

3421 C T T CC TGGAGC T C C AGGAAC C AGGC AG T GAGGC C T T GG T C TGAGAC AGT AT C C T C AGG T C 3480 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

3421 C T T CC TG GAGC T C C AGGAAC C AGGC AG T GAGGC C T T GG T C TGAGAC AGT AT C C T C AGGTC 3480 

34 81 AC AGAGC AGAG GATGC AC AGGGT G T GC C AGC AGTGAAT GT T T GC CC T GAAT GC AC AC C AA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3481 AC AGAGC AGAG GATGC AC AGGGT G TGC C AGC AGTGAAT GTTTGCCCT GAAT GC AC AC CAA 3540 

3541 GGG CC C C AC C T GC C AC AGGAC AC ATAGGAC TC C AC AGAGT C T GGCC T C AC C T C C C T AC T G 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3541 GGGCC C C AC C T GC C AC AGG AC AC AT AGGAC T C CAC AGAGT C T GG CC TCACCTCCC T AC TG 3600 

3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I 

3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

3661 C C T TC AG GT T T T C AGGGGAC AGGC C AAC C C AG AGGAC AGGAT T C CC T GGAGGC CAC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3661 C C T TC AGGT T T TC AGGGGAC AGGC C AAC C C AG AGGAC AGGAT T C CC T GGAGGC CAC AGAG 3720 

3721 GAGC AC C AAGGAGAAGATC TGTAAGTAGGC C T T TGT T AGAGT C T CC AAGGT T C AGT T C TC 3780 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

3721 GAGC AC C AAGGAGAAGATC T GTAAGTAGGC C T T TG T T AGAGT C T CC AAGGT T C AG T TC TC 3780 
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Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C C AC AC TCCTGCCTGCTGCCC TGAC GAGAGT C ATC ATGT C T C T T GAG C AGAGGAG 3900 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 3841 C C T GC C C AC AC TCCTGCCTGCTGCCCT G AC GAGAGT CAT CAT GT C T C T T GAGC AGAGGAG 3900 

Qy 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3901 T C T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGGC C C T GGGC C T GG T GTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

Qy 4081 CAT C AAC T T C AC TC GAC AGAGGC AACC C AGTGAGGG T T C C AGC AGC C G T GAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I 

Db 4081 CAT C AAC T T C AC TC GACAGAGGC AACC C AGTGAGGG TT C C AGC AGC C G TGAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 42 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AAT GC T GGAGAGT GTC AT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC 4320 

I M I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 42 61 AAT GC T GGAGAGT GT CAT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC 4 320 

Qy 4321 C T C TGAGTC C T T GC AGC T GG T C T T TGGC AT T GAC GT GAAGGAAG C AGAC C C C AC C GGC C A 4380 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I 

Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 

Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 4441 GAT C AT GCC C AAGAC AGGC T T C C T GAT AAT T G T CC T GGT C AT GAT T GC AAT GGAGGGC GG 4500 

Qy 4501 CCATGC T CC TGAGGAGGAAATC TGGGAGGAGC TGAG TGTGATGGAGGTGTAT GATGGGAG 4560 

I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I II I 

Db 4501 CCATGC TCC TGAGGAGGAAATC TGGGAGGAGC TGAG TGTGATGGAGGTGTAT GATGGGAG 4560 

Qy 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4620 

Qy 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4 740 


http://es/ScoreAccessWeb/GetItem.action? Appld=088 1 9669&seqld=6095 1 8&ItemName=us. . . 8/30/06 


1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 

Db 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 4741 GCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTTGAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 
Db 4741 GCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTTGAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGT C T GAGC AT GAGT T GC AGC C AAGGC C AG T GGGAGGGGGAC T GGGC C AG T GC AC C T T 48 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGT TGC AGCC AAGGC CAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4 921 GAAGAGAGC GG T C AG TGT T C T C AG TAGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4 980 

I I I I I i I I I I I i I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGC GG T C AG T GT T C T C AG TAGT AGGT T TC T GT TC TAT T GGGT GAC T T GGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 T T C AGC AT C C AAG T T T ATG AAT GAC AGC AGT C AC AC AGT T C TG T G TAT AT AG T T T AAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 T T C AGC AT C C AAGT T TAT GAAT GAC AGC AG TC AC AC AGT T C TGT G TAT AT AG T T T AAGGG 5100 

Qy 5101 T AAG AG TCTTGTGTTT TAT TC AGAT T GG GAAAT CC AT T C TAT T T TGT GAAT T GGGAT AAT 5160 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGT CTTGTGTTT TAT T C AGAT T GG GAAAT CC AT T C TAT T T T GT GAAT T GGGAT AAT 5160 

Qy 5161 AAC AGC AGT GGAAT AAGT AC T T AGAAAT G TGAAAAAT GAGC AG T AAAATAGAT GAGAT AA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AGTGGAAT AAGT AC T T AGAAAT GTGAAAAAT GAGC AGT AAAATAGAT GAGATAA 5220 

Qy 5221 AGAAC TAAAGAAAT T AAGAGAT AG T C AAT TC T T GC C T TAT AC C T C AGT C TAT T C T G T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 5221 AGAAC TAAAGAAAT T AAGAGAT AG T C AAT TC T T GC C T TAT AC C T C AGT C TAT T C T G T AAA 5280 

Qy 5281 AT T T T T AAAGAT AT AT GC AT AC C T GGAT T TC C T TGGC T TC T T T GAGAAT GT AAGAGAAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T T AAAGAT AT AT GC AT AC C T GGAT T TC C T TGGC T T C T T T GAGAAT GTAAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 T C T GC T T T T T G GAAGGC C C T GGGT TAGT AGT GGAGAT GC T AAGG TAAGC C AGAC T CAT AC 54 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C TAAAGATGT AGGGAAAAGT GAGAGAGGGG T GAGGGTG T GGGGC T C C GGG TGAG AGT G 5580 

I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C T C TAAAGAT G T AGGGAAAAGT GAGAGAGGGG T GAGGGT G T GGGGC T C C GGG TGAG AGT G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGC T GAT TGT AAT GAT C T T GGGT GGAT CC 5 674 
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MOLECULE TYPE: genomic DNA 
FEATURE : 

NAME /KEY : MAGE-1 gene 
US-08-142-368A-8 
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Matches 567 4; Conservative 


0%; Score 5674; DB 2; Length 5674; 
0%; Pred. No. 0; 

0; Mismatches 0; Indels 0; 


Gaps 


0; 


Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 C T C TC AAC C C AGGGAAGCC C AGGT GCC C AGAT GT GAC GCC AC T G AC T T GAGC AT TAGT GG 180 

181 T TAGAGAGAAG C GAGGT T T T C GGT C TGAGGGG C GGC T T GAGAT C GGT G GAGGGAAG CGGG 240 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I 

181 T TAGAGAGAAGC GAGGT T T T C GGT C TGAGGGGC GGC T TGAGATC GGTGGAGGGAAGC GGG 240 

241 CC C AGC T C TGT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC TGAGGAC C C AC T T AC C C C 300 


241 C C C AGC T C TGT AAGGAGGC AAGGT GACAT GC T GAGGGAGGAC T GAGGAC C C AC T T AC C C C 300 

301 AGAT AGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGAC CATC TGGTGGTGGACTTC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATC TGGTGGTGGACTTC 360 

361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I 
421 CTCCGTGT GAT C AGGGAAG GGC T GC T T AGGAGAGGGC AGC GT C C AGGC T C T GC C AG AC AT 480 

481 .CAT GC T C AGGAT TC T C AAG GAGGGC T GAGGGT C C C T AAGAC C C C AC TC C C GT GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I i 
481 CAT GC T C AGGAT TC T C AAG GAGGGC T GAGGGT C C C T AAGAC C C C AC T C C C GT GAC C C AAC 540 

541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I 
541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 
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Qy 781 GAAGCGAGGT T TC C AT TC T GAGGGAC GGC GT AGAGT TC GG C C GAAGGAAC C T GACC C AGG 840 

I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 1 I t I I I I I I I I I 
Db 781 GAAGC GAGGT T TC C AT T C T GAGGGAC GGC GTAGAGT TC GG C C GAAGGAAC C T GACC C AGG 840 

Qy 841 C TC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGAC TGAGGAC CCCGCC AC TCCAAATA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II I I I I I I I I I M I I I 
Db 841 C T C TGT GAGGAGGC AAGGT GAGAGGC TGAGGGAGGAC T GAGGAC C C C G C C AC T C C AAATA 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

Qy 1021 TTCTCCCCAAGCTCTGGAATCAGAGGTTGCTGTGACCAGGGCAGGACTGGTTAGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1021 T T C T C C C C AAG C TC T GGAAT C AGAGGT T GC TG T GAC C AGG GC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGT T TGC C C C T GC T C T C AAC C C AGGGAAGC CC T GGT AGGC C C GAT GT GAAAC C AC T GAC T 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 TGAACC T C AC AGAT C TGAGAGAAGC C AGGT TC AT T T AATGGT T C T GAGGGGCGGC T TGAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T GAACC T C AC AGAT C T GAG AG AAG CC AGGT TC AT T T AATG GT T C T GAGGGGC GGC T TGAG 1500 

Qy 1501 ATC C AC TGAGGGGAGTGGT TT T AGGC TC TGTGAGGAGGC AAGGT GAGATGC TGAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 ATC C AC T GAGG GGAG T GGT T T TAGGC T C T GTGAGGAGGC AAGG T GAGATGC TGAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGCC C C AAAATG ATC C AGT AC C ACC C C T GC T G 1620 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 
Db 1561 ACTGAGGAGGCACACACCCCAGGTAGATGGCCCCAAAATGATCCAGTACCACCCCTGCTG 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 

Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 17 40 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 AC C C T GGGAGGGAAC T GAGGGT T C C C C ACC C AC AC CTGTCTCCT CAT C TC C AC C GC C ACC 1860 

I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 1801 AC C C TGGGAGGGAAC TGAGGGT TC C C C ACC C AC AC CTGTCTCCT CAT C T C C AC C GC C ACC 18 60 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 T C AAC C C AC GGAAGC C ACG GGAAT GGC GGC C AGGC AC T C GGAT C T TGAC GT C C C CAT C C A 1980 

I I I II I I I I I I I II I I I II I I II I II I I I I I I I I I I I I I I I II I I I II I I I I I I II I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG T C T GAT GGAGGGAAGGGGC T T GAAC AGGG C C T C AGGGGAGC AGAGGGAGGGC C C TAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGGTC TGAT GGAGGGAAGGGGC T T GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

Qy 2041 T GC GAGAT GAGGGAGGC C T C AGAGGAC C C AGC AC C C TAGGAC AC CGC AC CCCTGTCT GAG 2100 

I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 T GC GAGAT GAGGGAGGC C T C AGAGGAC C C AGC AC C C TAGGAC AC C GC AC CCCTGTCT GAG 2100 

Qy 2101 AC T GAGGC T GC C AC TTCTGGCC T C AAGAAT C AGAAC GAT GGGGAC T C AGAT T GCAT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC T GAGGC TGC C AC TTCTGGCCTCAAGAATCAGAACGATGGGGACTC AGAT TGC AT GGGG 2160 

Qy 2161 GT GGGAC C C AG GC C T GC AAGGC T T ACGC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GT G GGAC C C AGGC C T GC AAGGC T T ACGC GGAGGAAGAGGAGGGAGGAC T C AG GGGAC C T T 2220 

Qy 2221 GGAAT C C AGAT C AGTGT GGAC C T C GGC C C T GAGAGG TC C AGGGC AC GGT GGC C AC AT ATG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2221 GGAAT C C AGAT C AG T GTGGAC C T C GGC C C TGAGAGG TC C AGGGC AC GGTGGC C AC AT AT G 2280 

Qy 2281 GC C CAT AT T T C C T GCAT C T T T GAGGTGAC AGGAC AGAGC T GT GG TC T GAGAAGT GGGGC C 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2281 GC C CAT AT T T C C T GCAT C T T T GAGGTGAC AGGAC AGAGC TGTGGTCT GAGAAGT GGGGC C 2340 

Qy 2341 T C AGGT C AAC AGAGGGAGGAGT TC C AGGAT C CAT AT GGC C C AAGATGT GC C C C C T T CAT G 2400 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 T C AGGT C AAC AGAGGGAGGAGT TC C AGGAT C CAT AT GGC C C AAGATG T GC C C C C T T C AT G 2400 

Qy 2401 AGGAC T GGGGATAT C C C C G GC T C AGAAAGAAG GGAC TC C AC AC AGT C T GGC TGTCCCCTT 2460 

I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 2401 AGGAC T GGGGATAT C C C C G GC T C AGAAAGAAGGGAC TC CAC AC AGT C T GGC TGTCCCCTT 24 60 

Qy 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 ACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCAGGAATAAAGATGAGT 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I M I 
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Db 2581 AC TCATGTCAGGGAAT TGGGGGT T GAGGAAGC ACAGGCGC TGGC AGGAATAAAGATGAGT 2640 

Qy 2641 GAGAC AGAC AAGGC TAT T GGAATC C AC AC C C C AGAAC C AAAGGGGTC AGC CC TGGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 GAGAC AGAC AAGGC TAT T GGAAT C C AC AC C C C AGAAC C AAAGGGGT C AGC C C T GGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

Qy 2761 CAT T C T C AGAGGGT GAC T C AGGT C AAC G T AGGGAC C C CC ATC T G GTC T AAAGAC AGAGC G 2820 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I 

Db 2761 CAT T C TC AGAGGG T GAC T C AGGT C AAC G TAGGGAC C C CC ATC T GGT C T AAAGAC AG AGC G 2820 

Qy 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2821 GT C C C AGGAT C T GC C ATGC GT TC GGGT GAGGAAC AT GAGGGAGGAC T GAGGG TAC C C C AG 2880 

Qy 2881 GAC C AGAAC AC TGAGGGAG AC T GC AC AGAAAT C AGC C C T GC C C C T GC T G T C AC C C C AGAG 2940 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2881 GAC C AGAAC AC T GAGGGAG AC T GC AC AG AAAT C AGC CCTGCCCCTGCT GT C AC C C C AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 AC GGGGAGGC C T T GG T C T GAGAAGGC TGC GC T C AGGT C AG T AGAGGGAGC G T C C C AGGC C 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 AC GGGGAGGC C T T GG T C T GAGAAGGC T GC GC T C AGGT C AG T AGAGGGAGC G T C C C AGGC C 3060 

Qy 3061 C TGCCAGGAGTC AAGGTGAGGACC AAGC GGGC ACC TCACC CAGGACAC AT TAAT TC CAAT 3120 

I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 C T GC C AG GAG T C AAGGT GAGGAC C AAGC GGGC AC C T C AC C CAGGACAC AT TAAT T C CAAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 32 41 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I LI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 33 60 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I 

Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 C T T C C T GGAGC T C C AGGAAC C AGGCAGT GAGGC C T T GGT C TGAG AC AG TAT C C T C AGGT C 3480 

I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3421 C T T C C T GGAGC T C C AGGAAC C AGGC AGT GAGGC C T T GGT C TGAG AC AG TAT C C T C AGGT C 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

M I I I I I I I I II I I I I I M I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 3481 AC AGAGC AGAG GAT GC AC AGGG T G T GC C AGC AGTGAATGT T TGC C C T GAAT GC AC AC C AA 3540 
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Qy 3541 GGGC C C C AC C T GC CAC AGG AC AC AT AGGAC T C C AC AGAGTC T GG C C TC AC C T C C C T AC T G 3600 

I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I M I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 C C T T C AGGT T T TCAGGGGAC AGGC C AAC C C AG AGGAC AGGAT T C C C T GGAGG C C AC AGAG 3720 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I E I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3661 C C T TC AGGT T T TCAGGGGAC AGGC C AAC C C AG AGGAC AGGAT TC C C TGGAGGC C AC AGAG 3720 

Qy 3721 GAGCACC AAGGAGAAGATC TGTAAGTAGGCC T T TGT TAGAGTC TCC AAGGTT CAGT TC TC 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 3721 GAG C AC C AAGGAGAAGATC TGTAAGTAG GC C T T T GT TAGAG T C T C C AAGGTT CAGT T C TC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I II I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C CAC AC TCCTGCCT GC TGC C C TGAC GAGAGT CAT CAT G T C TC T T GAGC AGAGGAG 3900 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I 
Db 3841 C C T GC CC AC AC T C C TGC C T GC T GC C C T GAC GAGAGT CAT CAT GT C T C T T GAG C AGAGGAG 3900 

Qy 3901 T C T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGGC C C TGGGC C T GG T GTG 3960 

I I I I I I I I I I I I I I I I I I I II II M I I I I I I I I I I I I I I I I I I I I I I I M I I I I | I I | I | 
Db 3901 TC T GC AC T GC AAGC C T GAG GAAGC C C T T GAGG C CC AAC AAGAGGC C C TGGGC C T GG T GTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CAC TGC T GGGT C AAC AGAT C C T CC C C AGAGT C C TC AGGGAGC CTCCGCCTTTCC CAC TAC 4080 

I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I II I I I I I M I I I I I I 
Db 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

Qy 4081 CAT C AAC T T CAC T C GAC AG AGGC AAC C C AGT GAGGG T T C C AGC AGC CGT GAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT C AAC T T CAC T C GAC AG AGGC AAC C C AG TGAGGG T T C C AGC AGC C GTGAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 42 61 AAT GC T GGAGAGT GT C AT C AAAAAT TAC AAGC AC TG T T T T C C T GAGAT C T T C GGC AAAGC 4320 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 61 AAT GC T GGAGAG T GT CAT C AAAAAT TAC AAGC AC TG T T T T C C T GAGAT C T T C GGC AAAGC 4 320 

Qy 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4 380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I II I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 
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Qy 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

I I I I I I I I t I II I I I I t I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I II I I I 1 I I 
Db 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

Qy 4 501 CCATGC TCC TGAGGAGGAAATC TGGGAGGAGC TGAG TGTGATGGAGGTGTAT GATGGGAG 4 560 

I I II I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I II I II I I I I I I I I I M II I I I I I 
Db 4 501 CC AT GC T C C TG AGGAGGAAAT C TGGGAGGAGC T GAG T GTGATGGAGG T GTAT GAT GGGAG 4 560 

Qy 4 561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 4561 GGAGC AC AGTGC C TAT GGGGAGC C C AGGAAGC TGC T C AC C C AAGAT T T GGTGC AGGAAAA 4 620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 4741 GC AAGAG T T CGC T T T T TC T TC CCATCC C TGC GT GAAGC AGC TT T GAGAGAGG AGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCTTCC C ATCC C TGC G TGAAGC AGC TT T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4921 GAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATT 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGC GG TC AG T GT T C T C AG T AGT AGG T TTCTGTTC TAT T GGGT GAC T TGGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 T AAGAG TCTTGTGTTT TAT T C AGAT TGGGAAAT C CAT T C TAT T T T G TG AAT T GGGAT AAT 5160 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 T AAGAG TCTTGTGTTT TAT T C AGAT TGGGAAAT C CAT T C TAT T T T G T G AAT T GGGAT AAT 5160 

Qy 5161 AAC AGCAGTGGAATAAGTAC T TAGAAATGTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AGT GGAATAAGT AC T T AGAAAT GT GAAAAAT GAGC AGT AAAATAGAT GAGAT AA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AAT T C T T GCC T T AT ACC T C AG T C TAT T C TG T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AAT T C T T GC C T TAT ACC T C AG T C TAT T C TG T AAA 5280 

Qy 5281 AT T T T TAAAGATAT AT GC ATAC C T GGAT T T C C T TGG C T T C T TT GAGAATG T AAGAG AAAT 5340 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T TAAAGATAT AT GC ATAC C T GGAT TTCCTTGGCTTCTTT GAGAAT G TAAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 


http://es/ScoreAccess\Veb/GetItem.action?AppId=088 1 9669&seqld=6095 1 8&ItemName=us. 


1 i 


I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I E 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C TAAAGATG TAGG GAAAAGT GAGAGAGGGG T GAGGGT G T GGGGC TC C GGG T GAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C TC TAAAGAT G TAGGGAAAAGTGAGAGAGGGG TGAGGGTG T GGGGC T C C GGG T GAGAGT G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I II I I I i I I II I I I I II 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGC TGATTGT AATGATC T T GGGT GGAT C C 567 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGC TGAT TGT AATGATC T T GGGT GGATCC 5674 
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Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I M I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | j | | | i | | | | | | | | | 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I. I I I I I 
Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 C T C TC AAC C C AGGGAAGC C C AGGT GCC C AGAT GTGACGC C AC TGAC T T GAGC AT T AGT GG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 1 | 
Db 121 C T C TC AAC C C AGGGAAGC C C AGGT GCC C AGAT GTGACGC C AC TGAC T T GAGC AT TAG T GG 180 

Qy 181 T T AGAGAGAAGC GAGGT T T T C GGT C TGAGGGGC GGC T T GAGAT C GGTGGAGGGAAGC GGG 240 

I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | 
Db 181 T T AGAGAGAAG C GAGGT T T T C GGT C TGAGGGGC GGC T T GAGAT C GGT GGAGG GAAGC GGG 240 

Qy 241 C C C AGC T C T G T AAGG AGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC C C AC T T AC C C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 C C C AGC T C T G TAAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC C C AC T T AC C C C 300 

Qy 301 AGATAGAGGAC C C C AAATAAT C C C T TCAT GC C AG T C C TGGAC C ATC T GGT GG T GGAC T T C 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AGATAGAGGAC C C CAAAT AAT C C C T TC AT GC C AGT C C T GGAC CATC T GGT GG T GGAC T T C 360 

Qy 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 T C AGGC T GGGC C AC C C C C AGC CCCCTTGCTGCT TAAAC C AC T GGGGAC T C GAAGT C AGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGC AGC GTCC AGGC TCTGCCAGACAT 480 

Qy 481 CAT GC T C AGGAT TC T C AAGGAGGGC TGAGGG T C CC T AAGAC C C C AC T C C C GT GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 4 81 CAT GC TC AGGAT TC T C AAGGAGGGC TGAGGGT C C C T AAGAC C C C AC T C C C GT GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I i I I I I I I I I I I I I I I I II I I I I I I 1 I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

Qy 781 GAAGC GAGG T T TC C AT T C T GAGGGACGGC GTAGAGT TC GG C C GAAGGAAC C T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGGT T TC C AT T C T GAGGGACGGC GTAGAGT TC GG C C GAAGGAAC C T GAC C C AGG 840 

Qy 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 C TC TGTGAGGAGGCAAGGT GAGAGGCTGAGGGAGGACTGAGGAC CC CGCCAC TCCAAATA 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

Qy 1021 T T C TC C C C AAG C TC T GGAAT C AGAGGT T GC T G T GAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 T TC TC C C C AAG C T C T GGAAT C AGAGGT T GC T G T GAC C AGGGC AG GAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 
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Qy 1441 TGAACC TCAC AGATC TGAGAGAAGCCAGGT TC ATT T AATGGT TC TGAGGGGC GGC T TGAG 1500 

I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1441 TGAACC TCACAGATC TGAGAGAAGCCAGGTTC AT TT AATGGT TC TGAGGGGC GGC T TGAG 1500 

Qy 1501 ATC CAC TGAGGGGAG TGGT T TTAGGCTC TGTGAGGAGGCAAGGTGAGATGCT GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1501 ATC CAC TGAGGGGAG T GGT T T TAGGC T C TGTG AGGAGGC AAGGT GAGATGC T GAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT CC AGTAC CAC C CC T GC TG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT C C AG T AC CAC C CC T GC TG 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 C C AGC C C T GGAC CAC C C GGC CAGGAC AGAT GT C T C AGC TGGAC C AC CCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 17 40 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCT CATC TCCACCGC CAC C 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 T C AAC C C AC GG AAGC C AC GGG AAT GGC GGC C AGGC AC T C GGAT C T T G AC GT C C C CAT C C A 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1921 TC AAC C CAC GG AAGC C AC GGGAAT GGC GGC C AGGC AC T C G GAT C T T GAC GT C C C CAT C C A 1980 

Qy 1981 GGG TC TGATGGAGGGAAGGGGC T T GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGG TC TGATGGAGGGAAGGGGC T T GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

Qy 2041 TGC GAGAT GAGGGAG GC C T C AGAGGAC C C AGC AC C C T AGG AC AC C GC AC CCCTGTCT GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II 
Db 2041 TGC GAGAT GAG GGAGGC C T C AGAG GAC C C AGC AC C C T AGGAC AC C GC AC CCCTGTCT GAG 2100 

Qy 2101 AC T GAGGC TGC CAC T T C TG GC C T C AAGAAT C AGAAC GAT GGGGAC T C AGAT T GC AT GGGG 2160 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC T GAGGC TGC CAC T T C TGGC C T C AAGAAT C AGAAC GAT GGGGAC T C AGAT T GC AT GGGG 2160 

Qy 2161 GT G GGAC C C AG GC C T GC AAGGC T TAC GC GGAGGAAG AGGAGGGAGGAC T C AG GGGAC C T T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I i I I I I I I I 
Db 2161 GT GGGAC C C AG GC C T GC AAGGC T T AC GC GGAGGAAG AGGAGGGAGGAC TC AG GGGAC C T T 2220 

Qy 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

Qy 2281 GC C CAT AT T T C C T GC AT C T T TGAG GT GAC AGGAC AG AGC T G T GG T C T GAGAAGTGGGGC C 2340 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 


http://es/ScoreAccessWeb/GetItem.action?AppId=088 1 9669&seqld=6095 1 8&ItemName=us.. 


1 1 


Qy 2341 TC AGGTC AAC AGAGGGAGGAG T T C C AGGAT C CAT AT GGC CC AAGAT GT GC C C C C T T C ATG 2400 

I I I I I I I E I I I I I I I II I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I II I I I I I I I I II I I 

Db 2341 TC AGGTC AAC AGAGGGAGGAGT TCCAGGATCC ATATGGCCCAAGATGT GCCC C C T TCATG 2400 

Qy 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

Qy 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC TCATGTC AGGGAATTGGGGGTT GAGGAAGC ACAGGCGC TGGC AGGAATAAAGAT GAGT 2 640 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 AC T CAT G T C AGGGAAT T GGGGGT T GAGGAAGC AC AGGCGC T GGC AGGAATAAAGAT GAGT 2640 

Qy 2641 GAGACAGACAAGGCTATTGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACACC 2700 

I I I I I I I I I I I I I I I II I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2641 GAGACAGACAAGGCTATTGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACACC 2700 

Qy 2701 T C AC CC AGGAT GTGGC TTCTTTTT C AC TCCTGTTTC C AGAT C T G GGGC AGGT GAGGAC C T 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 2761 CAT T C T C AGAGGGT GAC T C AGGT C AAC G TAGGGAC C C CC AT C T GGT C T AAAGAC AG AGC G 2820 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I | | | | | | | | 

Db 2761 CAT TCTCAGAGGGTGACTC AGGTC AACGTAGGGACCCCCATCTGGTCT AAAGAC AG AGCG 2820 

Qy 2821 GT C C C AGGAT C T GC C AT GC GT T C G GGT G AGGAAC AT GAGGGAGGAC T G AGGG TAC C C C AG 2880 

I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I | I I | 

Db 2821 GT C C C AGGAT C TGC C AT GC G T T C GGGTGAGGAAC AT GAGG GAGGAC T G AGGG TAC C C C AG 2880 

Qy 2881 GAC C AGAAC AC TGAG GGAGAC T GC AC AGAAATC AGC CCTGCCCCT GC T GT C AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2881 GACC AGAAC AC TGAGGGAGAC T GC AC AGAAAT C AGC CCTGCCCCT GCT GT C AC C C C AGAG 2940 

Qy 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 AC GGGGAGGC C T T GG T C TGAGAAG GC T GC GC T C AGGT C AG T AGAGGGAGC G T C C C AGGC C 3060 

Qy 3061 CT GC C AG GAG T CAAGGT GAGGAC CAAGC GGGC ACC T C AC C C AGGAC AC AT TAAT T C C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I II I I I I I I I I I I I I I I 

Db 3061 C T GC C AGGAG T CAAGGT GAGGAC CAAGC GGGC ACC T C AC C C AGGAC AC AT TAAT T C C AAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I 

Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 ACC AGC AAAAGGGC AGGAT CCAGGCCC TGCCAGGAAAAAT AT AAGGGCCCTGCGTGAGAA 3300 
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I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 3241 ACC AGC AAAAGGGC AGGAT C C AGGCC C T GC C AGGAAAAAT ATAAGGGC C C TGC GTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I II I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

Qy 3481 AC AGAGC AGAGGATG C AC AGGG T G T GC C AGC AGT GAAT G T T T GC CC TGAATGC AC AC C AA 3540 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T TCAGGT T T TCAGGGGACAGGC CAAC CCAGAGGACAGGAT TC CC TGGAGGCCAC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 C C T T CAGGT T T T C AGGGGAC AGGC CAAC C C AG AGGAC AGGAT T C CC TGGAGGC C AC AGAG 3720 

Qy 3721 GAGCACCAAGGAGAAGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTC 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGCACCAAGGAGAAGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C C AC AC TCCTGCCTGCTGCCC TGAC GAGAGT CAT CAT GT C TC T T GAGC AGAGGAG 3900 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 C C T GC C C AC AC TCCTGCCTGCTGCCC TGAC GAGAGT C AT C ATGT C T C T T GAGC AGAGGAG 3900 

Qy 3901 T C T GC AC T GC AAGCC TGAGGAAGC C C T T GAGGCC C AAC AAGAGG CC C T GGGC C T GG T GT G 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 T C T GC AC T GC AAGCC T GAGGAAGC C C T T GAGG CC C AAC AAGAGGC C C T GGGC C T GG T GT G 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4 021 C AC T GC TGGG T C AAC AGAT C C T C C C C AGAG TC C T C AGGGAGC CTCCGCCTTTCC C AC T AC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 C AC T GC T GGGT C AAC AGAT C C T C C C C AGAGTC C T C AGGGAGC CTCCGCCTTTCC C AC T AC 4080 

Qy 4081 CAT CAAC T T C AC T CGAC AG AGGC AAC C C AGT GAGGG T T C C AGC AGC C G TGAAGAGG AGGG 4140 

I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 408 T CAT CAAC T T C AC T CGAC AG AGGC AAC C C AGT GAGGG T TC C AGC AGC C G T GAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I ! I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AAT GC T GGAGAGT GT C ATC AAAAAT T AC AAGC AC TGTTTTCC TG AGAT C T T C GGC AAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4261 AAT GC T GGAGAGTGT CATC AAAAAT T AC AAGC AC TGTTTTCC TGAGAT C T T C GGC AAAGC 4320 

Qy 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4 380 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4 380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I M I I I I I I I I I I I II II I I I II I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I 

Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

Qy 4501 C CAT GC T C C T GAGGAGGAAATC T GGGAGGAGC TGAG T GTG ATGG AGGT G TAT GATGGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4501 C C ATGC T CC TGAGGAGGAAATC TGGGAGGAGC TGAG TGTGATGGAGGT G TAT GATGGGAG 4560 

Qy 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4620 

Qy 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4681 CCAAGGGCCCTCGCTGAAACCAGC TATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 681 CCAAGGGCCCTCGCTGAAACCAGC TATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 47 40 

Qy 4741 GC AAGAG TTCGCTTTTTCTTCC C ATCC C T GC G T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4741 GC AAGAG TTCGCTTTTTCTTCC C ATCC C TGC G T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II 

Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

Qy 4921 GAAGAGAGC GG T C AG TGT T C TC AG TAGT AGGT T T C T G T TC TAT T GGGT GAC T TGGAGAT T 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4921 GAAGAGAGC GG T C AG TGT T C TC AG TAGT AGGT T T C T GT TC TAT T GGGT GAC T T GGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 
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Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

Qy 5161 AAC AGC AGTGGAATAAGTAC TTAGAAAT GTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 5161 AAC AGC AGT GGAAT AAGT AC T TAGAAAT GT GAAAAATGAGC AGT AAAAT AGAT GAGAT AA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG TC AATT C T T GC C T TAT AC C TC AGT C TAT T C T GT AAA 5280 

II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 5221 AGAAC TAAAGAAAT T AAGAGAT AG TCAATTC T T GC C T TAT AC C T C AGT C TAT T C T G T AAA 5280 

Qy 5281 AT T T T TAAAGATAT AT GC AT AC C T GGAT T T C C T T GGC T T C T T T GAGAAT GTAAGAG AAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T TAAAGATAT AT GC ATAC C T GGAT T T C C T TGGC T TC T T TGAGAATG T AAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 54 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C TAAAGAT G T AGGGAAAAGT GAGAGAGGGG T GAGGGT G T GGGGC TC C GGG T GAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 5521 C T C TAAAGAT G TAGGGAAAAGT GAGAGAGGGG T GAGGGT G T GGGGC T C C GGG T GAGAGTG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 67 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAG C T GAT T G T AAT GAT C T T GGGT GGAT C C 5 67 4 
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NAME /KEY : MAGE-1 gene 
US-08-037-230D-8 

Query Match 100.0%; Score 5674; DB 3; Length 5674; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5674; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I E I I I I ! I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 C T C TC AAC C C AGGGAAGC C C AGGT GC C C AGAT G T GAC GC C AC TG AC T T GAGC AT TAGT GG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

Qy 181 T T AGAGAGAAG C GAGGT T T T C GGT C TGAGGGGC GGC T TGAGAT C GGT GGAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 181 TTAGAGAGAAGCGAGGTTTTCGGTCTGAGGGGCGGCTTGAGATCGGTGGAGGGAAGCGGG 240 

Qy 241 C C C AGC T C T GT AAGG AGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC C C AC T T AC CC C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 241 C C C AGC T C TGT AAGGAGGC AAGGT GAC AT GC T GAGGGAGG AC TG AGGAC CC AC T TAC C CC 300 

Qy 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 301 AGATAG AGGAC CCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

Qy 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 C ATGC T C AGGAT T C T C AAGGAGGG C T GAGGG T C CC T AAGAC C C C AC TC C C GT GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 481 C ATGC T C AGGAT T C T CAAGGAGGG C T GAGGGT C CC T AAGAC C C C AC TC CC GT GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 CC AGGAAAC AT C C GGGT GC C C GGAT G T GACGC C AC T GAC T T GC GC AT TGT GG GGC AGAGA 780 

Qy 781 GAAGC GAGGT T T C CAT T C T GAGGGAC GGC G T AGAGT T C GGC C GAAGGAAC C T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GAAGC GAGGT T T C CAT T C T GAGGGAC GGC GT AGAGT T C GGC C GAAGGAAC C T GAC C C AGG 840 

Qy 841 C T C T GTGAGGAGGC AAGG T GAGAGGC TGAGGGAGGAC T GAGGAC C C C GC C AC T C C AAAT A 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 C T C T GTGAGGAGGCAAGGT GAGAG GC TGAGGGAGGAC T GAGGAC C C C GC C AC T C C AAAT A 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 C G T C T C AGC C T GGGC TGC C C C C AG AC C C C T GC T C C AAAAGC C T T GAGAGAC AC C AGGT T C 1020 

Qy 1021 T T C T CC C C AAGC T C T GGAATC AGAGGT TGC T GT GAC CAGGGC AGGAC T GGT T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 TTCTCCCCAAGCTCTGGAATCAGAGGTTGCTGTGACCAGGGCAGGACTGGTTAGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 
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Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I E I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I II I I I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 TGAAC C T C AC AGAT C T GAGAGAAGC C AGG T T C AT T T AAT GGT T C TGAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TGAAC C T C AC AGAT C T GAGAGAAGC CAGGT T CAT T T AAT GGT TC TGAGGGGC GGC T T GAG 1500 

Qy 1501 ATC C AC T GAGGGGAG T GGT T T T AGGC T C TGT GAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 ATC C AC T GAGGGGAG T GGT T T T AGGC T C T GT GAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C CAGGT AGAT GGC C C C AAAAT GAT C C AGTAC C AC CCCTGCTG 1620 

I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 
Db 1561 AC T GAGGAGGC AC AC AC C C CAGGT AGAT GGC C C C AAAAT GAT C C AGTAC C AC CCCTGCTG 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG T C T GAT GG AGGGAAGGGGC T T GAAC AGGGC C T C AGGGGAGC AGAG GGAGGGC C C TAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 1981 GGG T C T GAT GG AGGGAAGGGGC T T GAAC AGGGC C T C AGGGGAGC AGAGGGAGGGC C C TAC 204 0 

Qy 2041 TGC GAGAT GAGGGAGGC C T C AGAGGAC C C AGC AC C C TAGGAC AC C GC AC CCCTGTCT GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 TGC GAGAT GAG GGAG GC C T C AGAGGAC C C AGC AC C C TAGGACAC C GC AC CCCTGTCT GAG 2100 
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Qy 2101 AC T GAGGC TGC C AC T T C TGGCC TC AAGAATC AGAAC GATGGGGAC TC AGAT T GCAT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I f I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 AC T GAGGC TGC C AC T TC TGGCC TC AAGAATC AGAAC GATGGGGAC TCAGATT GCAT GGGG 2160 

Qy 2161 GTGGGAC CC AGGCC T GCAAGGC TTACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGACC TT 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 G T GGGAC CC AG GC C T GCAAGGC T T ACGC GGAGGAAGAGGAGGGAGGAC TC AGGGGAC C T T 2220 

Qy 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 T C AGGTC AAC AGAGG GAGGAGT TC C AGGAT C CAT AT GGC C C AAGATG T GC CC C C T T CAT G 2400 

Qy 2401 AGGAC TGGGGATAT C C C C GGC T C AGAAAGAAGGGAC T C C AC AC AGTC T GGC TGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

Qy 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T C ATG T C AGGGAAT T GGGGG T T GAGGAAGC AC AGGC GC TGGC AGGAAT AAAGAT GAGT 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 AC T C ATG T C AGGGAAT T GGGGG T T GAGGAAGC AC AGGC GC TGGC AGGAAT AAAGAT GAGT 2640 

Qy 2641 GAGACAGACAAGGC TAT TGGAATCCACACCCC AGAAC CAAAGGGGTCAGCCC TGGACACC 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 GAGACAGACAAGGC TATTGGAATCCACACCCC AGAAC CAAAGGGGTCAGCCC TGGACACC 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 27 61 CAT T C TC AGAG GG T GAC T C AGGT C AAC G T AGGGAC C C C C ATC T G G TC T AAAGACAGAGC G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I 

Db 27 61 CAT T C TC AGAG GG T GAC T C AGGT C AAC G T AGGGAC C C C C ATC T GG TC T AAAGACAGAGC G 2820 

Qy 2821 GTC CC AGGAT C T GC C AT GC GT TC GGGTGAGGAAC ATGAGG GAGG AC T G AGGG TAC C C C AG 2880 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2821 G T C C C AGGAT C T GC C AT GC G T T C GGGTGAGGAAC AT GAGGGAGG AC TGAGGG TAC C C C AG 2880 

Qy 2881 GACCAGAACAC TGAGGGAGACTGCACAGAAATCAGCCCTGCCCC TGCTGTCACCCCAGAG 2 940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2881 GAC C AGAAC AC T GAGGGAGAC T GC AC AGAAAT C AGC CCTGCCCCTGCT GTC AC CC C AGAG 2940 

Qy 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 941 AGC ATGGGCTGGGCC GTC TGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTC AGGG 3000 

Qy 3001 AC GGGGAGGC C T T GG T C TG AGAAGGC T G C GC T C AGGT C AG T AGAGGGAGC GT C C C AGGC C 3060 
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Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C TGC C AGGAGT CAAG GTGAGGAC C AAGC GGGC AC C TC AC C C AGGAC AC AT T AAT T C C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I ! I I I I I I I II I I I I I I I I I I I I I I 
Db 3061 C T GC C AGGAGT C AAGGT GAGGACC AAGC GGGC AC C TC AC C C AGGAC AC AT TAAT TC C AAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I! I II 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 AC C AGC AAAAGGGC AGGAT C C AGGC C C T GCC AGGAAAAAT AT AAGGGC C C T GC GT GAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 3241 AC C AGC AAAAGGGC AGGAT C C AGG C C C T GC C AGGAAAAAT AT AAGGGC C C T GC GT GAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I 
Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 C T T C C T GGAGC TCC AGGAAC C AGG C AGT GAGGC C T T GGT C T GAG AC AG TAT C C T C AGGT C 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 C T T C C TG GAGC TC C AGGAAC C AGG C AGT GAGGC C T T GGT C T GAG AC AG TAT C C T C AGG T C 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

• I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 34 81 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGC C C C AC C T GC C AC AGGAC AC AT AGGAC T C C AC AGAG T C T GG C C T C AC C T C C C T AC TG 3600 

I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 GGGC C C C AC C T GC C AC AGGAC AC AT AGGAC T C C AC AGAGT C T GGC C T C AC C T C C C T AC T G 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T TC AGGT T T T C AG GGGAC AGGC C AAC C CAGAGGAC AGGAT T C C C T G GAGGC C AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 CC T TC AGGT T T TC AG GGGAC AGGC C AAC C CAGAGGAC AGGAT T C C C T GGAGGC C AC AGAG 3720 

Qy 3721 GAGCACCAAGGAGAAGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTC 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGC AC C AAGGAGAAGATC T GT AAGT AGGC C T T TGT T AGAGT C T C C AAGGT T C AGT T C T C 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 CCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 3841 CC T GC C C AC AC TCCTGCCTGCTGCCCT GAC GAGAGT C AT C ATGT C TC T T GAGC AGAGGAG 3900 

Qy 3901 TC TGC AC TGC AAGC C T GAG GAAGC C C T T GAGGC CC AAC AAG AGGC C C T GGGC C T GG TGT G 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 C AC T GC T GGGT C AAC AGAT C C TC C C C AGAGT C C TC AGGGAGC CTCCGCCTTTC C C AC T AC 4080 

I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4021 C AC T GC T GGGT C AAC AGAT C C T C C C C AGAGT C C TC AGGGAGC CTCCGCCTTTCC C AC TAC 4080 

Qy 4081 CAT C AAC T T C AC TC GAC AGAGGC AAC C C AGTGAGGGT TC C AGCAGC C G T GAAGAGG AGGG 4140 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 4081 CAT C AAC T T C AC TC GAC AGAGGC AAC C CAGT GAGGGT TC C AGCAGC C G T GAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 42 61 AAT GC TGGAGAGT GT C AT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T TC GGC AAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4 500 

Qy 4501 CC AT GC T C C T GAGGAGGAAAT C T GGGAGGAGC T GAGT GT GATGG AGG T GT AT GAT GGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4501 CC AT GC T C C T GAGGAGGAAAT C T GGGAGGAGC T GAGT GT GAT GGAGG T GT AT GATGGGAG 4560 

Qy 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4561 GGAGCAC AGTGC C TATGGGGAGCC CAGGAAGC TGC TCACC C AAGATT T GGTGCAGGAAAA 4620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4 740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4 740 

Qy 4 741 GC AAGAG TTCGCTTTTTCTTC C C AT C C C T GC GT GAAGC AGC T T T GAGAGAGGAGGAAGAG 4 800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 4741 GC AAGAG TTCGCTTTTTCTTC C C AT C C C T GC GT GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 48 60 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4801 GGAGTC TGAGCATGAGTTGCAGCCAAGGCC AG TGGGAGGGGGACTGGGCC AGTGC ACCTT 4860 
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Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4921 GAAGAGAGC GG T C AG T GT T C TC AG TAGT AGGT TTCTGTTC TAT T GGGTGAC T TGGAGAT T 4980 

I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGC GG TC AG T GT T C T C AG T AGT AGG T TTCTGTTC TAT T GGGTGAC T TGGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 T T C AGC AT C C AAGT T TAT GAATGAC AGC AGT C AC AC AGT T C T GT G TAT AT AG T T T AAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 T T C AGC AT C C AAGT T TAT GAAT GAC AGC AGT C AC AC AGT TC T GT GTAT AT AG T T T AAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

Qy 5161 AAC AGCAGT GGAAT AAGTAC T T AGAAAT GT GAAAAATGAGC AGT AAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGCAGTGGAATAAGTAC T TAGAAAT GTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

Qy 5221 AGAAC TAAAGAAAT T AAGAGAT AG TC AAT TC T T GC C T TAT AC C T C AGT C TAT T C T G TAAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 5221 AGAAC TAAAGAAAT T AAGAGAT AG T C AAT TC T T GC C T TAT AC C T C AGT C TAT T C T G TAAA 5280 

Qy 5281 AT T T T TAAAGAT AT AT GC ATAC C T GGAT TTCCTTGGCTTCTTT GAGAAT GTAAGAGAAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 52 81 AT T T T TAAAGAT AT AT GC AT AC C T GGAT T T C C T T GG C T T C T T T GAGAAT G T AAGAG AAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTT T GGAAGGC C C T GGGT T AG T AG TGGAGATGC T AAGG TAAGC C AGAC TC AT AC 54 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTT T GGAAGGC C C T GGGT TAG TAG TGGAGATGC T AAGG TAAGC C AGAC TC AT AC 5460 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C TAAAGAT G T AGGGAAAAG TGAGAGAGGGG T GAGGG TGTGGGGCTCC GGG TGAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C TC TAAAGAT G TAGGGAAAAG TGAGAGAGGGG T GAGGGT GTGGGGC T C C GGG TGAGAGTG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 
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4 1 


Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I 

Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 C TC T CAAC C C AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC T GAC T T GAGC AT T AGT GG 180 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I 
Db 121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

Qy 181 T TAGAGAGAAG C GAGGT T T T C GGT C TGAGGGGC GGC T T GAGAT C GGTGGAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 T TAGAGAGAAG C GAGGT T T T C GGT C TGAGGGGC GGC T T GAGAT C GGT GGAGGGAAGC GGG 240 

Qy 241 C C C AGC T C T GT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC C CAC T T AC C CC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I 
Db 241 C C C AGC T C T GT AAGGAGGC AAGGT GAC ATGC T GAGGGAGGAC T GAGGAC C CAC T T AC C CC 300 

Qy 301 AGATAGAGGAC C C C AAAT AAT C C C T TC AT GC C AGTC C T GGAC CATC TGGTGG T GGAC T T C 360 

I I I I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AGATAGAGGAC CCCAAATAATCCC TTCATGCC AGTC CTGGAC CATC TGGTGGTGGACTTC 360 

Qy 361 TCAGGC T GGGC CAC C CC C AGC C C C C T TGC TGC T TAAAC CAC T GGGGAC T C GAAGT C AGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CAT GC T C AGGAT T C T C AAGGAGGGC T GAGGGT C C C T AAGAC C C C AC T C C C GT GAC C CAAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

Qy 781 GAAGCGAGGTTTCCATTCTGAGGGACGGCGTAGAGTTCGGCCGAAGGAACCTGACCCAGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 781 GAAGCGAGGTTTCCATTCTGAGGGACGGCGTAGAGTTCGGCCGAAGGAACCTGACCCAGG 840 

Qy 841 C TC T GT GAGGAGGC AAGGT GAGAG GC T GAGGGAGGAC TGAGGAC C C C GC C AC T C C AAAT A 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 C TC T GT GAGGAGGC AAGGT GAGAGGC TGAGGGAGGAC T GAGGAC C C C GC C AC T C C AAAT A 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 
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Qy 
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Qy 

Db 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 


901 


961 


961 


I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 


960 


CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 


1021 TTC TCCC CAAGC TC T GGAATC AGAGGT T GC TGTGACCAGGGCAGGAC TGGT T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 T TC TC C C C AAGC TC T GGAATCAGAGGT T GC TG TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 12 60 

1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I II I I 
1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

1441 T GAACC T C AC AGATC T GAGAGAAGC C AGGT TC AT T T AAT GGT TC TGAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 T GAACC T C ACAGATC T GAGAGAAGC C AGGT TC AT T T AATGGT TC TGAG GGGC GGC T T GAG 1500 

1501 AT C C AC T GAGGGGAG T GGT T T TAGGCTC T GTGAGGAGGC AAGG T GAGAT GC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 AT C C AC T GAGGGGAG TGGT T T TAG GC TC TG TGAGGAGGCAAGGT GAGAT GC T GAGGGAGG 1560 

1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGCC C C AAAATGAT C C AGT AC C AC CCC T GC T G 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGCC C C AAAATGAT C C AG T AC C AC CCCTGCTG 1620 

1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I E II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

1741 GGT C AGGAGAGGCAGGGCC CAGGC ATCAAGGT C CAGCATC CGCC C GGC AT TAGGGT CAGG 1800 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 
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Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG TC T GAT GGAGGGAAGGGGC TT GAAC AGGGC C T C AGGGGAGC AGAGGGAGGGC C C TAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGG TC T GAT GGAGGGAAGGGGC TT GAAC AGGGC C T C AGGGGAGC AGAG GGAGGGC C C TAC 2040 

Qy 2041 TGC GAGATGAGGGAGGCC TCAGAGGACCCAGC ACC C TAGGACAC CGCAC CCC TGTC TGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 TGC GAGATGAGGGAGGCC TCAGAGGACCCAGC ACCC TAGGACAC CGCACCCC TGTC TGAG 2100 

Qy 2101 AC T GAGGC TGC C AC T T C TGGC C TC AAGAAT C AGAAC GAT GGGGAC T C AGAT T GC AT GGGG 2160 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC T GAGG C T GC C AC T T C TGGC C TCAAGAATC AGAAC GAT G GGGAC TC AGAT T GC AT GGGG 2160 

Qy 2161 GT GGGAC C C AG GC C T GC AAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC TC AG GGGAC C T T 2220 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GT GGGAC C C AGGC C T GC AAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC TC AGGGGAC C T T 2220 

Qy 2221 GGAAT C C AGAT C AGT GT GGAC C TC GGC C C TGAGAGG TC C AGGGC AC GG TGGC C AC AT AT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 TC AGG T C AAC AGAGGGAGGAGT TC C AGGAT C CAT AT GGC C C AAGAT GT GC C C C C T T CAT G 2400 

Qy 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 24 60 

Qy 24 61 T T AGT AGC T C T AGGGGGAC C AGAT C AGGGAT GGCGG T AT G T T C C AT T C T C AC T TG T AC C A 2520 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 T T AGT AGC T C T AGGGGGAC C AGAT C AGG GAT GGCGG TAT G T T C C AT TC T C AC T T G T AC C A 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I II I II I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC TCATGTC AGGGAATTGGGGGTTGAGGAAGC ACAGGCGC TGGC AGGAATAAAGATGAGT 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 ACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCAGGAATAAAGATGAGT 2640 

Qy 2641 GAGACAGACAAGGCTATTGGAATC CACACCCCAGAACCAAAGGGGTCAGCCC TGGACACC 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GAGAC AGAC AAGGC TAT T GGAATC C AC AC C C C AGAACC AAAGGGGTC AGC C C TGGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 
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Qy 27 61 CAT TC T C AGAGGG T GAC TC AGGTC AAC G T AGGGAC C CC C ATC T G GT C T AAAGAC AGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 27 61 C AT TCTCAGAGGGTGACTC AGGTC AACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2821 GTC CC AGGAT C T GC CAT GC GT TC GGGT GAGGAAC AT GAGGGAGGAC TGAGGG TAC C C C AG 2880 

Qy 2881 GAC C AGAAC AC T GAG GGAGAC TGC AC AG AAAT C AGC CC T GC C C C T GC TGT C AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2881 GAC C AGAAC AC T GAG GGAGAC TGC AC AG AAAT C AGC CC T GC C CC T GC T GT C AC C C C AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

- I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 AC GGGGAGGC C T T GG TC TGAGAAGGC T GC GC T C AGG TC AG T AGAGGGAGC GT C C C AGGCC 3060 

Qy 3061 C T GCC AGGAGT C AAGGT GAGGAC C AAGC GGGC AC C T C AC C C AGGAC AC AT TAAT T C C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 3061 C T GCC AGGAGT C AAGGT GAGGAC C AAGC GGGC AC C T CACC C AGGAC AC AT TAAT TC C AAT 3120 

Qy 3121 GAAT T T T GAT AT CTCTTGCTGCCCTTCCC C AAGGAC C T AGGC AC GT GT GGC C AGAT GT T T 3180 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 3241 AC C AGC AAAAGGGC AGGAT C C AGGC CC T GC C AGGAAAAAT ATAAGGGC C C T GCGT GAGAA 3300 

Qy 3301 C AG AGGG GGT C AT C C AC TGC AT GAGAG T GGGG AT GT C AC AGAGT C C AGC C C AC C C T C C TG 3360 

I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I ! I I I I I I 

Db 3301 C AGAGGG GGT C AT C C AC TGC AT GAGAGT GGGG AT G T C AC AGAGT C C AGC C C AC C C T C C TG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3421 C T T CC T GGAGC T C C AGGAAC C AGG C AGT GAGGC C T T GGT C T GAG AC AG TAT C C T C AGGT C 3480 

Qy 3481 AC AGAGC AGAG GAT G C AC AGGGT G TGC C AGC AGT GAATGT T T GC C C T GAAT GC AC AC C AA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGCC C C AC C T GC C AC AGGAC AC AT AGGAC T C C AC AGAG TC TGGC C TC AC CT C C C TAC T G 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 GGG CC C C AC C T GC C AC AGGACAC ATAGGAC TC C AC AGAGT C T GG C C T C AC C T C C C TAC T G 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 
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1 A 


Qy 3661 C CT TC AG GT T T T C AGGGGAC AGGC C AAC CC AG AGGAC AGGAT T C C C T GGAGGC C AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 C C T T C AGGT T T TC AGGGGAC AGGC C AAC C C AG AGGAC AGGAT T C C C TGGAGGC C AC AGAG 3720 

Qy 3721 GAGC AC C AAGGAGAAGATC T GTAAGT AGGC C T T T GT TAGAGT C T C C AAGGT T C AGT TC T C 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I 
Db 3721 GAGC AC C AAGGAGAAGAT C TGTAAG T AGGC C T T TGT TAGAGT C T C C AAGGT T C AGT TC TC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I II I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GCCC AC AC TCC T GC C T GC T GC C C TGAC GAGAGT CAT CAT G T C T C T TGAGCAGAGGAG 3900 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 C C T GCC C AC AC TCCTGCCTGCTGCCC TGAC GAGAGT CAT CAT GT C T C T TGAGCAGAGGAG 3900 

Qy 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I 
Db 3901 T C T GC AC TGC AAGC C TGAG GAAGC C C T T GAGGC C C AAC AAGAGG C C C T GGGC C TGG TG T G 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 4021 C AC TGC T GGGT C AAC AGAT C C TC C C C AG AGT C C T C AGGGAGC CTCCGCCTTTCC C AC T AC 4080 

Qy 4081 CAT C AAC T TCAC T C GAC AG AGGC AAC C C AGTG AGGG T T C C AGC AGC C G T GAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT C AAC T TC AC TC GAC AG AGGC AAC C C AG TGAGGG T T C C AGC AGC C G T GAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I II I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4201 TGAT TTGGTTGGTTTTC TGC TCC TCAAATATC GAGC C AGGGAGC C AGT C AC AAAGGCAGA 4260 

Qy 4261 AAT GC T GGAGAGT GT C AT C AAAAAT TAC AAGC AC T G T T T T C C TGAG AT C T T C GGC AAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4261 AATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGC 4 320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I 
Db 4 381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4 440 

Qy 4441 GAT CATGCCCAAGAC AGGC TTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4 500 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GAT CATGCCCAAGAC AGGC T TCC TGAT AAT TG TCC TGGTC AT GAT TGC AATGGAGGGCGG 4500 

Qy 4501 C C AT GC TCC TGAGGAGGAAATC TGGGAGGAGC TGAG TG T GAT GG AGG T GT AT GATGGGAG 4560 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 4501 C C ATGC TCC TGAGGAGGAAAT C TGGGAGGAGC T GAG T GTG ATGGAGGT GTATGATGGGAG 4560 

Qy 4 561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4 740 

Qy 4741 GC AAGAG TTCGCTTTTTCT TCC C AT C C C TGCG T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCTTCC C ATC C C T GC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGT C T GAGC ATGAGT T G C AGC C AAGGC C AG T GGGAGGG GGAC T GGGCC AG TGC AC C TT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I II I I I I I I I I I 
Db 4801 GGAGT C T GAGC ATGAG T T GC AGC C AAGG C C AG T GGGAGGG GGAC T GGGC C AG TGC AC C T T 4860 

Qy 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

Qy 4921 GAAGAGAGC GG T C AG T GT T C T C AGT AGT AGG T T T C T GT TC TAT T GGGT GAC T T GGAGATT 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGC GG T C AG T GT T C T C AGT A<GT AGGT T T C T GT T C TAT T GGGTGAC T TGGAGAT T 4980 

Qy 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 T TC AGC ATC C AAGT T TAT GAAT GAC AGC AG T C AC AC AGT T C T GT GT AT AT AG T T TAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTT TAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

Qy 5161 AAC AGC AGT GG AAT AAG T AC T T AG AAAT G T GAAAAAT GAGC AG T AAAAT AGAT GAG AT AA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AGT GG AAT AAGT AC T TAG AAAT G TGAAAAAT GAGC AG T AAAAT AGAT GAG ATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGATAGT C AAT TC T T GC C T TAT AC C T C AGT C TAT T C TG T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAG AT AGT C AAT TCTTGCCT TAT AC C T C AGT C TAT T C TG T AAA 5280 

Qy 5281 AT T T T T AAAGATAT AT GC ATAC C T GGAT TTCCTTGGCTTCTTT GAG AAT GT AAGAG AAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T T AAAGATAT AT GC ATAC C T GGAT TTCCTTGGCTTCTTT GAGAAT GT AAGAG AAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTG 5580 

I E I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

II I II I I I I I I I I I I I I II M I I i I I I I II I I I I I I M I I I I I I II I I I I I I I I I I I I II 

Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGC TGAT TGT AATGATC TT GGGT GGATCC 567 4 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 
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Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 AT C C AAAC AT C T T C AC GC T C AC C C C C AGCC C AAGC C AGGC AGAAT C C GGT TC C AC C C C T G 120 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AT C C AAAC AT C T T C AC GC T C AC C C C CAGCC C AAGC C AGGC AGAAT C C GGT TC C AC C C C T G 120 

Qy 121 C T C T C AAC C C AGGGAAGCC C AGGT GC C C AGAT GT GACGC C AC T GAC T T GAGC AT T AGT GG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 C T C T C AAC C C AGGGAAGCC C AGGT GCC C AGAT GT GACGC C AC T GAC T T GAGC AT T AGT GG 180 

Qy 181 T TAGAGAGAAGC GAGGT TT T C GGT C TGAGGGGC GGC T T GAGAT C GGT GGAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 T TAGAGAGAAGC GAGGT TT T C GGT C TGAGGGGC GGC T T GAGAT C GGT GGAGG GAAGC GGG 240 

Qy 241 C C C AGC T C T GT AAGGAGGC AAGGT GAC ATGC T GAGGGAGGAC T GAGGAC C C AC T T AC C C C 300 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I ! I I 
Db 241 C C C AGC T C T GT AAGGAGGC AAGGT GAC ATGC T GAGGGAGGAC T GAGGAC C C AC T T AC C C C 300 

Qy 301 AGAT AGAGGAC C C C AAAT AAT C C C T TC ATGC C AGT C C T GGAC C AT C T GGT GG T GGAC T T C 360 

I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AGAT AGAGGAC C C C AAAT AAT C C C T TC ATGC C AGT C C T GG AC CAT C T GGT GG T GGAC T T C 360 

Qy 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGC AGC GTCC AGGC TCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I i I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGC GTCC AGGC TCTGCCAGACAT 480 

Qy 481 CAT GC T C AGGAT T C T C AAG GAGGGC TGAGGGT C C C T AAGAC C C C AC T C C C GT GAC C C AAC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 481 C AT GC TC AGGAT T C T C AAGGAGGGC T GAGGGT C C C T AAGAC C C C AC TC C C GT GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 


http://es/ScoreAccessWeb/GetItem .action? Appld=088 1 9669&seqld=6095 1 8&ItemName=us. . . 8/30/06 


Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I E I I I 1 I I I I I I I 
Db 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

Qy 781 GAAGC GAGGT T TC C AT T C T GAGGGACGGC GT AGAGT T C GGC C GAAGGAAC C T GAC C C AGG 840 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGGT T T C CAT T C T GAGGGAC GGCGT AGAGT T C GGC C GAAGGAAC C T GAC C C AGG 840 

Qy 841 CTCTGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCACTCCAAATA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 C T C T G T G AGGAGGC AAGGT GAGAGGC TGAGGGAGGAC T GAGGAC C C C GC C AC TC C AAAT A 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CG T C TC AGC C T GGGC T GC C C C C AGAC C C C TGC T CC AAAAGC C T T GAGAGAC AC C AGGT TC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 C G T C TC AGC C T GGGC T GC C C C C AGAC C C C TGC T C C AAAAGC C T T GAGAGAC AC C AGGT TC 102 0 

Qy 1021 T TC TC CC CAAGC TC T GGAATCAGAGGT TGC TGTGAC C AGGGCAGGAC T GGT TAGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 T TC TC C C CAAGC TC T GGAATCAGAGGT TGC TGTGAC CAGGGCAGGAC TGGT TAGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGT T TGC CCC TGC TCTCAACCCAGGGAAGCCC TGGT AGGCCCGATGTGAAACCACT GAC T 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 TGAACCTCACAGATCTGAGAGAAGCCAGGTTCATTTAATGGTTCTGAGGGGCGGCTTGAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TGAAC C T CACAGATC TGAGAGAAGCCAGGTTC ATT T AATGGT TC TGAGGGGC GGC T TGAG 1500 

Qy 1501 AT C C AC T GAGGGGAG T GGT T T T AGGC T C TG TGAGGAGGC AAGG T GAGATGC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 AT C C AC T GAGGGGAG T GGT T T T AGGC T C TG T GAGGAGGC AAGG T GAGAT GC T GAGG GAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT C C AGT AC C AC C C C T GC T G 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT C C AGTAC C AC CCCTGCTG 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 
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I E I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I 
Db 17 41 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 AC C C T GGGAGGGAAC T GAGGGT TC C C CAC C C AC AC CTGTCTCCT CATC T C C AC C GC CAC C 18 60 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG T C T GATGGAGGGAAGG GGC T T GAAC AGGGC C T C AGGGGAGC AGAGGGAG GGC C C T AC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGGTCTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAGAGGGAGGGCCCTAC 2040 

Qy 2041 T GC GAGAT GAGGGAG GC C T C AGAGGAC C C AGC AC C C T AGGAC AC CGC AC CCCTGTCT GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 T GC GAGAT GAGGGAG GC C T C AGAGGAC C C AGC AC C C T AGGAC AC CGC AC CCCTGTCT GAG 2100 

Qy 2101 AC T GAGGC TGC CAC T T C T GGC C TC AAGAAT C AGAAC GAT G GGGAC T C AGAT T GC ATGGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC TGAGGC TGC CAC T TC TGGCC TC AAGAATCAGAAC GAT G GGGAC TC AGAT T GC ATGGGG 2160 

Qy 2161 GT GGGAC C C AGGC C T GC AAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GT G GGAC C CAGGC C T GC AAGGC TT AC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

Qy 2221 GGAAT C C AGAT C AGT GT GG AC C TC GGC C C TGAGAGG TC C AGGGC AC GG T GGC C AC ATAT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAAT C C AGAT C AG T GT GG AC C TC GGC C C T GAGAGG TC C AGGGC AC GG T GGC CAC ATAT G 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2 341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

Qy 2401 AGGAC T G GGGATAT CCCCGGCT C AGAAAGAAG GGAC T C CAC AC AGT C TGGCTGTCCCCTT 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGGAC T GGGGATAT CCCCGGCT C AGAAAGAAG GGAC T C CAC AC AGT C T GGC TGTCCCCTT 24 60 

Qy 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I 
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Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T C ATG TC AG GGAAT TGGGGG T T GAGGAAGC AC AGGC GC T GGC AGGAATAAAGAT GAGT 2640 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AC T C ATG TC AGGGAAT TGGGGGT T GAGGAAGC AC AGGC GC TGGC AGGAATAAAGAT GAGT 2640 

Qy 2641 GAGAC AG AC AAGGC T ATT GGAATC C AC AC C C C AGAAC C AAAGGGGTC AGC C C T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GAG AC AG AC AAGGC T ATT GGAATC C AC AC C C C AGAAC C AAAGGGGTC AGC C C T GGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

Qy 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 61 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GT C C C AGGATC T GCC ATGC GT T C G GGT GAGGAAC AT GAGGGAGGAC TG AGGGT AC C C C AG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 G T C C C AGGATC TGCC ATGC GT T C GGGT GAGGAAC AT GAGGGAGGAC T G AGGGT AC C C C AG 2880 

Qy 2881 GAC C AGAAC AC TGAGGGAG AC T GC AC AG AAAT C AGC CCTGCCCCT GC T GTC AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GAC C AGAAC AC TGAGGGAG AC TGC AC AGAAAT C AGC CCTGCCCCT GC T GTC AC C C C AGAG 2940 

Qy 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C TGC CAGGAGT CAAGGTGAGGACC AAGC GGGCACC T CAC C CAGGACAC AT TAAT TC CAAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 C T GC CAGGAGT C AAGGTGAGGAC C AAGC GGGC AC C T CAC C CAGGACAC AT TAAT T C CAAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 AC C AGCAAAAGGGCAGGAT CCAGGCCC T GCC AGGAAAAAT ATAAGGGC CC TGCGTGAGAA 3300 

I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 AC C AGC AAAAGGGCAGGAT CC AGGC CC T GC C AGGAAAAAT ATAAGGGC CC TGC GTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I 
Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3421 C T T C C TGGAGC TC C AGGAAC C AGGC AGT GAGGC C T T GGTC T GAGAC AG TAT C C T C AGGT C 3480 
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Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T TCAGGT T T TCAGGGGACAGGC CAAC CCAGAGGAC AGGATTC CC TGGAGGCCAC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 CC T TCAGGTT T TCAGGGGACAGGC CAAC CCAGAGGACAGGATTC CC TGGAGGCCAC AGAG 3720 

Qy 3721 GAG C AC C AAGG AGAAGAT C TGTAAG TAGGC C T T TGT T AGAGTC T C C AAGGT T C AGT T C T C 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGC ACC AAGG AGAAGATC TGTAAG TAGGCC T TTGT T AGAGTC TCC AAGGT TC AGT TCTC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 CC T GC C C AC AC TCCTGCCTGCTGCCCT GAC GAGAG T CAT C ATG T C TC T T GAGC AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 CCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAG 3900 

Qy 3901 TC T GC AC T GC AAGC C TGAG GAAGC C C T T GAGGC C C AAC AAGAGGC C C T GGGC C T GG T GT G 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 3901 TC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGG C C CAAC AAGAGGC C C T GGGC C T GG T GT G 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 C AC T GC T GGGT C AAC AGAT C C TCC C C AGAGT C C T C AGGGAGCC T C C GC C T T T C C C AC TAC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

Qy 4081 CAT CAAC T TC AC TC GAC AGAGGC AACC C AGT GAGGG T TC C AGC AGC C G T GAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT CAAC T TC AC TC GAC AGAGGC AACC C AG T GAGGG T TC C AGC AGC C G T GAAGAGGAGGG 4140 

Qy 4141 GC C AAGC AC C T C T TG T AT C C T GGAGTC C T TG T T C CGAGC AG T AATC AC T AAGAAGG T GGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 4141 GC C AAGC AC C T C T TG T AT C C T GGAGTC C T T G T T C CGAGC AG T AATC AC T AAGAAGG T GGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 42 60 

Qy 4261 AATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AAT GC T G GAGAGT GT C AT C AAAAAT TAC AAGC AC TG T T T T C C TGAGAT C T TC GGC AAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 
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Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I 
Db 4441 GAT C ATGC C C AAGAC AGGC T T C C T GAT AAT TGT C C T GGTC AT GAT T GC AATGGAGGGCGG 4500 

Qy 4501 C CAT GC T C C T G AGGAGGAAAT C T GGGAGGAGC TGAG T GTGAT GGAGG T GT AT GAT GGGAG 4560 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4501 C CAT GC T C C T GAGGAGGAAATC T GGGAGGAGC T GAG TGTGATGGAGGT GT AT GATGGGAG 4560 

Qy 4561 GGAGCAC AGTGCC TATGGGGAGCC CAGGAAGC TGC TCACC CAAGAT TT GGTGCAGGAAAA 4620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 561 GGAGCAC AGT GC C TAT GGGGAGC C CAGGAAGC T GC T CACC CAAGAT T T GGT GC AGGAAAA 4 620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 47 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 681 C C AAGGGC CC T C GC T GAAACC AGC TAT G T GAAAGT C C T T GAGT ATGT G ATC AAGGT C AG T 4740 

Qy 4741 GC AAG AG TTCGCTTTTTCTTCC CAT C C C T GC G T GAAGC AGC T T T GAGAGAGG AGGAAGAG 4800 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCT TC CC AT C C C T GCG TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4 921 GAAGAGAGC GG TC AG T G T T C TC AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T TGGAGAT T 4 980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 921 GAAGAGAGC GG TC AG T GT T C T C AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T TGGAGAT T 4 980 

Qy 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I [ I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 TAAGAGT CTTGTGTTT TAT T C AGAT T GG GAAAT CC ATT C TAT T T TGT GAAT T GGGAT AAT 5160 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGT CTTGTGTTT TAT TCAGATTGGGAAATCCATTC TAT TTTGTGAATTGGGATAAT 5160 

Qy 5161 AAC AGC AGTGGAATAAGTAC T TAGAAAT GTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AG T GGAAT AAGT AC T TAGAAAT GTGAAAAATGAGCAGT AAAAT AGAT GAG AT AA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAG AGAT AG TC AAT T C T T GCC TT AT ACC T C AGT C TAT T C TG T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC TAAAGAAAT T AAGAGATAG T C AAT T C T TGC C T TAT AC C T C AGTC TAT T C T G T AAA 5280 

Qy 5281 AT T T T T AAAGAT AT ATGC AT AC C T GGAT T TC C T T GGCT TC T T T GAGAAT GT AAGAGAAAT 5340 
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1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 

Db 5281 AT T T T TAAAGATAT ATGC AT AC C T GGAT TTCCTTGGCTTC T TTGAGAATGTAAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TC T GC T T T T TG GAAGGC C C T GGGT T AGT AGTGGAGAT GC T AAGG TAAG C C AGAC TC AT AC 54 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 01 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I IE I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C T AAAGAT G TAGGGAAAAGTGAGAGAGGGG TGAG GGTG T GGGGC T C C GGG TGAGAGTG 5580 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C T C T AAAGAT G TAGGGAAAAGT GAGAGAGGGG T GAGGGT G T GGGGC T C C GGG TGAGAGTG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCTGATTGTAATGATCTT GGGT GGAT CC 5 674 
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Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

It I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 C T C TC AAC C C AGGGAAGC C C AGG T GCC C AGAT GT GAC GC C AC T G AC T T GAGC AT TAGTGG 180 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 C T C TC AAC C C AGGGAAGC C C AGG T GC C C AGAT GT GAC GC C AC T GAC T T GAGC AT T AGT GG 180 

Qy 181 T T AGAGAGAAG C GAGGT T T T C GG T C T GAGGGGCGGC T T GAGAT C GGT GGAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TTAGAGAGAAGCGAGGTTTTCGGTCTGAGGGGCGGCTTGAGATCGGTGGAGGGAAGCGGG 240 

Qy 241 C C C AGC T C T GT AAGG AGGC AAGGT GAC AT GC T GAGG GAGGAC T GAGGAC C C AC T T AC C C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 241 C C C AGC T C T GTAAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC C CAC T TAC C C C 300 

Qy 301 AGATAGAGGAC C CC AAATAAT C C C T T CAT GCC AGT C C T GGAC CATC T GG T GG T GGAC T TC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I 
Db 301 AGATAGAGGAC C C C AAATAATC C C T T CAT GC C AGT C C T GGAC CATC T G G T GG T GGAC T T C 360 

Qy 361 TC AGGC T GGGC CAC C C C C AGC CCCCTTGC TGC T T AAAC CAC T GG GGAC T C GAAG T C AGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TC AGGC T GGGC CAC C C C C AGC C C C C T T GC TGC T TAAAC CAC TGGGGAC T C GAAGTC AGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 
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I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I i I I I I 1 I I I I I I I I I I I I I I I II I I 

Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CAT GC T C AGGAT TC TC AAG GAGGG C TGAGGGT C C C T AAGAC C C C AC T C C C GT GAC C C AAC 540 

I I I I I I II I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 481 CAT GC T C AGGAT TC TC AAGGAGGGC TGAGGGT C C C T AAGAC CC C AC T C C C GT GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I 1 I I I I 

Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

Qy 781 GAAGC GAGGT T T C CAT T C T GAGGGAC GGCGTAGAGT T C GGC C GAAGGAAC C T GAC C C AGG 8 40 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGGT T T C CAT T C T GAGGGAC GGCGTAGAGT T C GGC C GAAGGAAC C T GAC C C AGG 840 

Qy 841 C TC TGT GAGGAGGC AAGGT GAGAGGC T GAGGGAGGAC T GAGGAC C C C GC C AC T C C AAAT A 900 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 C TC TGT GAGGAGGC AAGGT GAGAGGC T GAGGGAGGAC T GAGGAC C C C GC C AC T C C AAAT A 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 9 60 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 961 C GT C T C AGCC T GGGC T GCC C C C AGAC CCCTGCTC C AAAAGC C T T GAGAGAC AC C AGG T TC 1020 

Qy 1021 T T C TC C C C AAGC TC T GGAAT C AGAGGT T GC TGT GAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I II I I I I I I I I II 
Db 1021 T T C TC C C C AAGC TC T GGAAT C AGAGGT T GC TGT GAC C AGGGC AGGAC TGGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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UD 

1 OOI 

ppp appptp atptptptp atgtgppppaptpppatpgcctccccCATTCTGGCAGAATCC 

1380 

Qy 

1381 

GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 

1440 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


UD 

Loo 1 


1440 

Qy 

1441 

TGAACCTCACAGATCTGAGAGAAGCCAGGTTCATTTAATGGTTCTGAGGGGCGGCTTGAG 

1500 


I | | | I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


UD 

1 A A 1 
1 fl H x 

tpa apptp ap a^atp tgagagaagppaggttp ATTTAATGGTTCTGAGGGGCGGCTTGAG 

1500 

Qy 

1501 

ATC C AC T GAGGGGAGTGGTTT T AGGCTC TGTGAGGAGGC AAGGTGAGATGC TGAGGGAGG 

1560 


I I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 


UD 

XjUI 

a tp r nr t a a cccc AG Tf;GT T T T AGGP TP T GTG AGGAGGC AAGG T GAGATGC T GAGGGAGG 

1560 

Qy 

1561 

ACTGAGGAGGCACACACCCCAGGTAGATGGCCCCAAAATGATCCAGTACCACCCCTGCTG 

1620 


M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 


UD 

IjDI 

APTaArv^AaGP APAP APPPPAGGTAGATGGCCCCAAAATGATCCAGTACCACCCCTGCTG 

1620 

Qy 

1621 

CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 

1680 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


UD 

1 COI 

± X 

pp APPPPTP^APPAPPPGGPPAGGAPAGATGTPTPAGPTGGACCACCCCCCGTCCCGTCC 

^ v^rt.vjv_/ v^ \* 1 wvj/t.v_/ v^rtvV_. v_,\_. vjvjv.* v^rt.vj0.rt\^rt\j.rt. lUlvl ^»rtu^ J- vj vj.rtJV-* j™vv^ v^v^v^v^\-»vj x ^» \j x \^ 

1680 

Qy 

1681 

CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 

1740 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


DD 

1 DO X 

p APTf^PP APTT A APPPAP AGGGP AATPTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 

1740 

Qy 

1741 

GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 

1800 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


UD 

~\ ~l A"\ 

ppTPZiPPZifiACr^P AP^GGPPP AGGP ATP A AGGTPP AGP ATCCGCCCGGCATTAGGGTCAGG 

1800 

Qy 

1801 

ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 

1860 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


UD 

1 oni 

7iPPPTPPPnpPPZ\APT^AP,P,nTTPPPP APPP AP APPTGTPTPPTP ATP TCP APCGCCACC 

^ X vJOvjrt.vjvjvxrtrt.v_/ X wrUjvjvJ X X v_» v_« v*« -rtv-' v>.rtv-t rt.v_» v*f lul^ 1 v 1 v_>./"\x v-« x Vrfvn.o^\JWy/Tw 

1860 

Qy 

1861 

CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 

1920 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


UD 


rr* ii p TP npi*TTPPPl\TZ\PPTAPPP PPT APPPPP AAPPTP ATPTTGTP AGAATCCCTGCTG 

t»,L.rt.v- 1 \^J-\\^r\ 1 X OLk/nl/iv-L lrt.v_.v_.v-.v_v_ l i-\.v^ v- v_ v.. v_-.rtrt.v_. v_ l v^rvx lui v^fvvjfi/T.x v^ x \jv x vj 

1920 

Qy 

1921 

TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 

1980 


1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


UD 


TP n iippp ZiPPP z\Zi P.PP APCP-P- A AT(^P-P(^P-PP AGGP AP TP GG ATP TTGAPGTC PP CATC CA 

X v^rt-TV-* V-«.rt.V_> vJvTrtXT.VJv-- ^ ./-\.\_. Vj vj VJ/vrt X vTvJv^ VJUV_. V-.-rt.VJVJV_.rt.V_. x v_» vjvj,rtx v_. x x vj.rt.v_.vj x V/^vvn X v^^v 

1980 

Qy 

1981 

GGGTCTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAGAGGGAGGGCCCTAC 

2040 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


UD 

1 QQ1 

ppp TP TP ATf^AHP-G A AGGGGPTTG A AP AGGGPP TP AGGGGAGCAGAGGGAGGGCCCTAC 

2040 

Qy 

2041 

TGCGAGATGAGGGAGGCCTCAGAGGACCCAGCACCCTAGGACACCGCACCCCTGTCTGAG 

2100 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 


UD 

9 C\ A 1 
Z U H ± 

TPPP,A^ATf^AP^GG AGGPPTP AGAGGAPPP AGP APCC TAGGACACCGCACCCCTGTCTGAG 

2100 

Qy 

2101 

ACTGAGGCTGCCACTTCTGGCCTCAAGAATCAGAACGATGGGGACTCAGATTGCATGGGG 

2160 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


nu 
UD 


HfTGaGGPTGrr APTTPTGGPPTP AAGAATCAGAACGATGGGGACTCAGATTGCATGGGG 

2160 

Qy 

2161 

GTGGGACCCAGGCCTGCAAGGCTTACGCGGAGGAAGAGGAGGGAGGACTCAGGGGACCTT 

2220 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


UD 

OI CI 

P,T GGG A P P P A GGP P T GP A A GGP T T AP GC GGAGGAAG AGGAGGGAGG AC T CAGGGG AC C T T 

2220 

Qy 

2221 

GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 

2280 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

2221 

GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 

2280 
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Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 T C AGGTC AAC AGAGGGAGGAGT TC C AGGATC C AT AT GGC C C AAGAT GT GC C C C C T T CAT G 2400 

I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 T C AGGTC AAC AGAGG GAGGAGT TC C AGGATC C AT AT GGC C C AAGAT GT GC C C C C T T CAT G 2400 

Qy 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
Db 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 24 60 

Qy 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2 581 ACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCAGGAATAAAGATGAGT 2 640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 ACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCAGGAATAAAGATGAGT 2 640 

Qy 2641 GAGACAGACAAGGCTATTGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACACC 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 641 GAGAC AG AC AAGGC TAT TGGAAT C C AC ACC C C AGAAC C AAAGGGGT C AGC C C T GGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 2761 CAT T C T C AGAGGG T GAC T C AGGTC AAC G T AGGGAC C C C CAT C T GG T C T AAAGAC AGAGC G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 CAT T C T C AGAGGG T GAC T C AGGTC AAC G T AGGGAC C C C CAT C T GGT C T AAAGAC AGAGC G 2820 

Qy 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 GTC C C AGGATC T GC C AT GC G T T C GGGT GAGGAAC AT GAGG GAGGAC T GAGGG T AC C C C AG 2880 

Qy 2881 GAC C AGAAC AC T GAG GGAGAC T GC AC AGAAAT C AGC CCTGCCCCT GC T GT CAC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GAC C AGAAC AC T GAG GGAGAC TGC AC AGAAATC AGC CCTGCCCCTGCT GT C AC C C C AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 AC GGGGAGGC CTTGGTCT GAGAAG GC T GC GC T C AGGT C AG T AGAGGGAGC GT C C C AGGC C 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTC AGGTC AG TAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C T GC C AGGAGT CAAGGT GAGGAC CAAGC GGGC ACC T CAC C C AGGAC AC AT TAAT T C C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3061 C T GC C AGGAG T C AAG G TGAGGAC CAAGC GGGC ACC TC AC C C AGGAC AC AT TAAT TC C AAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 
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Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 32 41 AC C AGC AAAAGGGC AGGAT CC AGGC C C T GC C AGGAAAAAT AT AAGGGC C C TGCGTGAGAA 3300 

I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I II I I I I I I I t I I I I I I I I I I I I I I I I I I I I 

Db 3241 AC C AGC AAAAGGGC AGGAT CC AGGC C C T GC C AGGAAAAAT AT AAGGGC C C T GCGTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I 

Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGC AC TGAGAAGC C AGGGC T GT GC T T GC GG T CT GC AC C C TGAGGGC C C GT GGAT TCC T 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 3361 GTAGC AC T GAGAAGC C AGG GC T GT GC T T GC GG T C T GC AC C C TGAGGGC C C GT GGAT TC C T 3420 

Qy 3421 C T T CC TGGAGC TC C AGGAACCAGG C AGT GAGGC C T T GGTC TGAG AC AG T ATC C TC AGG T C 3480 

I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3421 C T T CC T GGAGC TC C AGGAAC C AGGC AGT GAGGC C T T GGTC T GAG AC AG TAT C C TC AGGT C 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 

Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 GGGCC CC AC C T GC C AC AGGACAC AT A£G AC T C C AC AGAGT C T GGC C TC AC C T CC C T AC T G 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T TCAGGT T T TCAGGGGACAGGC CAAC CCAGAGGACAGGATTC CC TGGAGGCCAC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3661 CC T TCAGGT T T TCAGGGGACAGGC CAAC C CAGAGGACAGGATTC CC TGGAGGCCAC AGAG 3720 

Qy 3721 GAGC AC C AAGGAGAAGAT C TGT AAG TAGGC C T T TG T T AGAGTC T CCAAGGT T C AGT T C T C 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3721 GAGC AC C AAGGAGAAGAT C TG T AAGT AGGC C T T TGT TAGAG T C T CCAAGGT T C AGT T C T C 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C C AC AC TCCTGCCTGCTGCCCT GAC GAGAG T C AT C ATG T C T C T T GAGC AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3841 C C T GC C C AC AC TCCTGCCTGCTGCCCT GAC GAGAGT C AT C AT GT C T C T T GAG C AGAGGAG 3900 

Qy 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

I I I I I I I I I I I II I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3901 T C T GC AC T GC AAGC C T GAG GAAGC C C T T GAGG C C C AAC AAGAGGC CC T GGGC C T GG TG T G 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

Qy 4081 CAT CAAC T T C AC TC GAC AG AGGC AACC C AGT G AGGG T TC C AGC AGC CG T GAAGAGGAGGG 4140 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 4081 C ATC AAC T TC AC T C GAC AGAGGC AACC C AGT G AGGG T TC C AGC AGCCG TGAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 42 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AATGC TGGAGAGT GT C AT C AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T TC GGC AAAGC 4320 

I I I ! i II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AATGC TGGAGAGT GT CATC AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

Qy 4501 C C ATGC T C C T GAGGAGGAAAT C TGGGAGGAGC T GAGTGT GAT GGAGGT GT AT GAT GGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 4 501 CC AT GC T C C T GAGGAGGAAAT C T GGGAGGAGC T GAGT GT GAT GGAGGT G TAT GAT GGGAG 4 560 

Qy 4 561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

Qy 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 4741 GCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTTGAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTTGAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy . 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4921 GAAGAGAGC GG T C AG T GT T C T C AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 921 GAAGAGAGC GG T C AG T GT T C TC AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4 980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
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Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGT CTTGTGTTT TAT TC AGAT TGGGAAAT C C AT TC TAT T T T GT GAAT T GGGATAAT 5160 

Qy 5161 AAC AGCAGTGGAATAAGTAC T TAGAAAT GTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGCAGTGGAATAAGTAC T TAGAAAT GTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGATAG TC AAT TC T T GC C T TAT AC C T C AG T C TAT T C TG T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAGATAG TC AAT T C T T GC C T TAT AC C TC AG TC TAT T C TGT AAA 5280 

Qy 5281 AT T T T T AAAGATAT ATGC AT AC C T GGAT T T C C T T GGC T T C T T T GAGAATGT AAGAGAAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T T AAAGATAT ATGC AT AC C T GGAT T TC C T T GG C T T C T T T GAGAATGT AAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 54 00 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I - 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 T C T GC T T T T T GGAAGGC C C T GGG T T AGT AGT GGAGATGC T AAGG T AAGC C AGAC TC AT AC 54 60 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C TC T AAAGAT G TAGGGAAAAGTGAGAGAGGGG T GAGGGT GT GGGGC T C C GGG T GAGAG TG 5580 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C TC T AAAGATG TAGGGAAAAGT GAGAGAGGGG T GAGGG T GT GGGGC T C C GGG T GAGAG TG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGC T GAT T GT AAT GAT C T T GGGT GGAT C C 5 674 

I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGC T GAT TGT AAT GAT C T T GGGT GGAT C C 5674 
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Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AT C C AAAC AT C T T C AC GC T C AC C C C C AGCC C AAGC C AGGC AGAAT C C GGT TC C AC C C C TG 120 

Qy 121 C T C TC AAC C C AGGGAAGCC C AGGT GC C C AGAT GT GACGC C AC T GAC T T GAGC AT T AGT GG 180 

I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 C TC TC AAC C C AGGGAAGCC C AGG T GC C C AGAT GTGACGC C AC T GAC T T GAGC AT T AGT GG 180 
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Qy 181 T T AGAGAGAAGC GAGGT T T T C GGT C T GAGGGGC GGC T TGAGAT C GGTGGAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I 
Db 181 T T AGAGAGAAGC GAGGT T T T C GGT C TGAGGGGC GGC T TGAGATC GGTGGAGGGAAGC GGG 240 

Qy 241 CC C AGC TC TGT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC CC AC T T AC C CC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CC C AGC T C TGT AAGGAGGC AAGGT GAC ATGC T GAGGGAGGAC T GAGGACCC AC T T AC C CC 300 

Qy 301 AGAT AGAGGAC C C C AAATAAT C C C T TC ATGC C AGTC C T GGAC CAT C TGGTGGTGGAC T TC 360 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I 
Db 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATC TGGTGGTGGAC TTC 360 

Qy 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 T C AGGC T GGGC C AC C C C C AGC CCCCTTGCTGCT TAAAC C AC T GGGGAC TCGAAGT C AGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CAT GC TC AGGAT TC T C AAG GAGGGC T GAGGGT C C C T AAGAC CC C AC TC C CGT GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 CATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

Qy 781 GAAGC GAGGT TTC CAT T C T GAGGGAC GGCGTAGAGT TCGGCC GAAGGAAC C T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 781 GAAGC GAGGT T TC C AT T C T GAGGGAC GG CGTAGAGT T CGGC CGAAGGAAC C T GAC C C AGG 840 

Qy 841 C T C TG TG AGGAGGC AAGG T GAG AGGC T GAGGGAGGAC TGAGGAC C C C G C C AC T C C AAAT A 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 C TC T GT GAGGAGGC AAGGT GAGAGGC TGAGGGAGGAC TGAGGAC C C C GC C AC TC C AAATA 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 901 GAG AGC C C C AAAT AT TC C AGC CCCGCCCTTGCTGCC AGC C C TGG C C C AC C C GCGGG AAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I II II II I I I I I II I I I I I I I 
Db 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

Qy 1021 TTCTCCCCAAGCTCTGGAATCAGAGGTTGCTGTGACCAGGGCAGGACTGGTTAGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1021 T TC TCCC C AAGC TCT GGAATCAGAGGT TGC TGTGAC C AGGGC AGGAC T GGTT AGGAGAGG 1080 
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Qy 1081 GCAGGGCACAGGCTC TGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGC TGTGGGCCC 1140 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I I I I 

Db 1081 GCAGGGC AC AGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGC TGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 T GAAC C T C AC AGAT C T GAGAGAAGC CAGGT T CAT T T AAT GG T T C TGAG GGGC GGC T TGAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db ' 14 41 T GAAC C T CAC AGAT C T GAGAGAAGC CAGGT TC AT T T AAT GGT TC T GAGGGGC GGC T TGAG 1500 

Qy 1501 AT C CAC T GAGGGGAG T GGT T T TAGGC T C TGTGAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 AT C CAC T GAGG GGAG T GG T T T TAGGC T C T GT GAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGG T AGAT GGC C C C AAAAT GAT C C AGTAC CAC CCCTGCTG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I 

Db 1561 AC T GAGGAGGC AC AC AC CC C AGG T AGAT GGC C C C AAAAT GAT C C AGTAC CAC CCCTGCTG 1620 

Qy 1621 C C AGC CC T GGAC CAC C C GGC C AGGAC AGATGT C TC AGC T G GAC C AC CCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I 

Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 17 41 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCT CATC TCCACCGC CAC C 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCT CATC TCCACCGC CAC C 18 60 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGGTCTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAGAGGGAGGGCCCTAC 2040 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GGGTC TGATGGAGGGAAGGGGC TT GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

Qy 2041 T GC GAGAT GAGGGAGGC C T C AGAG GAC C C AGC ACCC TAGGAC AC C GC ACC C C T GT C TGAG 2100 

I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I t I I I 
Db 2041 TGC GAGAT GAGGGAGGC C T C AGAGGAC C CAGC AC C C TAGGAC AC CGC ACCC C TGTC T GAG 2100 

Qy 2101 AC TGAGGC TGC CAC T TC TGGCCTC AAGAATCAGAAC GATGGGGAC TCAGAT TGCATGGGG 2160 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC T GAGGC T GC CAC T T C TGGC C TC AAGAATCAGAAC GATG GGGAC TCAGAT TGC AT GGGG 2160 

Qy 2161 GT G GGAC C C AG GC C T GCAAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC TC AGGGGAC C T T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I E I I I 
Db 2161 GT GGGAC C C AGGC C T GCAAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC TC AGGGGAC C T T 2220 

Qy 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 T C AGGT C AAC AGAGGGAGGAG T TC C AGGAT C C AT AT GGC C C AAGATGT GC C C C C T T C ATG 24 00 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 T CAGGT C AAC AGAGGGAGGAG T T C C AGGAT C C AT AT GGC C C AAGATGT GC C C C C T T C ATG 2400 

Qy 2401 AGGAC T GGGGAT ATC C CC GGC TC AGAAAGAAG GGAC T C C AC AC AGTC T GGC TGTCCCCTT 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGGAC T GGGGAT ATC CC C GGC TC AGAAAGAAGGGAC T C CAC AC AGTC T GGC TGTCCCCTT 2460 

Qy 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I 
Db 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2 580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T CAT G TC AGGGAAT TGG GGGT T GAGGAAGC AC AG GC GC T GGC AGGAAT AAAGAT GAGT 2 640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IE I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AC T CAT G T C AG GGAAT TGG GGGT T GAGGAAGC AC AG GC GC T GGC AGGAAT AAAGAT GAGT 2 640 

Qy 2641 GAGAC AGAC AAGGCT ATTG GAAT C CAC AC C C C AGAAC C AAAGGGGTC AGC C C T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GAGAC AGAC AAGGCT AT TG GAAT C CAC AC C C C AGAAC C AAAGGGGTC AGC C C T GGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I 
Db 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

Qy 2881 GAC C AGAAC AC T GAGGGAGAC TGC AC AGAAAT C AGC CC TGCCCCTGCTGT CAC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 2881 GAC C AGAAC AC TGAGGGAGAC TGC AC AGAAAT C AGC CCTGCCCCTGCT GT C AC C C C AGAG 2940 

Qy 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 
Db 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I 
Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C T GC C AGGAG T C AAGGT GAGGAC C AAGC GGGC AC C T C AC C C AGG AC AC AT TAAT T C C AAT 3120 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 3061 C T GC C AGGAGT C AAGGT GAGGAC C AAGC GGGC AC C T C AC C C AGGAC AC AT TAAT TC C AAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I J I I I I I I I 
Db 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 CAGAGGG GG TC AT C C AC T GC AT GAGAGT GGGGAT GT C AC AGAG T C C AGC C C AC C C T C C T G 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 C T T C C T GGAGC T C C AGGAAC C AGG C AGT GAGGC C T T GGTC T GAG AC AG T ATC C T C AGGT C 3480 

I I I I I I I I I I I I I 1 II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 3421 C T T C C T GGAGC T C C AGGAAC CAGGC AGT GAGGC C T T GGT C T GAG AC AG T ATC C T C AGGT C 3480 

Qy 3481 AC AGAGC AGAGGAT G C AC AGGGT G TGC C AGC AG T GAATG T T T GC C C TGAAT GC AC AC C AA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3481 AC AGAGC AGAGGAT G C AC AGGGTG T GC C AGC AGT GAATGT T T GC C C T GAAT G C AC AC C AA 3540 

Qy 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T T C AGGT T T T C AG GGGAC AGGC CAAC C C AG AGGAC AGG AT T C C C T GGAGGC C AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 CC T T C AG GT T T T C AGGGGAC AGGC CAAC C C AGAGGAC AGGAT TC C C T GGAGGC CAC AGAG 3720 

Qy 3721 GAGC AC C AAGGAGAAGATC TGT AAGTAG GC C T T TG T T AGAG T C T C C AAGG T T C AGT T C T C 3780 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 3721 GAGCACCAAGGAGAAGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 
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Qy 3841 C C T GC C C AC AC T C C T GC C T GC TGC C C TGAC GAGAGT C ATC AT GT C TC T T GAGC AGAGGAG 3900 

I I I I I I I I I I I I I I I E I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I 

Db 3841 C C T GC C C AC AC T CC T GC C T GC TGC C C TGAC GAGAGT CATC AT GT C TC T TGAGC AGAGGAG 3900 

Qy 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I 

Db 3901 TC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C C AACAAGAGGC C C T GGGC C TGG TGTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I II I I I I I I I 

Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 C AC TGC TGGGT C AAC AGAT C C TC C C C AGAG T C C T C AGGGAGC C T C C GC C T T T C C C AC TAC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4021 C AC TGC T GGGT C AAC AGAT C C TC C C C AGAGT C C T C AGGGAGC C T C C GC C T TT C C C AC TAC 4080 

Qy 4081 CAT C AAC T T CAC TC GAC AGAGGCAACC C AGT GAGGG T T C C AGC AGC C G T GAAGAGGAGGG 4140 

I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I 

Db 4081 CAT C AAC T T CAC TC GAC AGAGGCAACC C AGT GAGGG T TC C AGC AGC C G TGAAGAGG AGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4141 GC C AAGC ACC T C T TGT AT C C T GGAGTC CTTGTTCC GAGC AGT AAT CAC T AAGAAGG T GGC 4200 

Qy 4201 TGAT TTGGTTGGTTTTCTGCTCCT C AAATAT C GAGC C AGGGAGC C AG T CAC AAAGGC AGA 42 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AAT GC T GGAGAGT GTC AT C AAAAAT TAC AAGC AC TGTTTTCCT G AGAT C T T C GGC AAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4261 AAT GC TGGAGAGT GTC AT C AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4 380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GAT CAT GC C C AAGAC AGGC T T C C T GAT AAT TG T CC T GGTC AT GAT T GC AAT GGAGG GC GG 4 500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 441 GAT CAT GC C C AAGAC AGGC T T C C T GAT AAT TG T CC T GGTC AT GAT T GC AAT GGAGG GC GG 4 500 

Qy 4501 C CAT GC T C C T GAGGAGGAAAT C TGGGAGGAGC T GAG TGTGAT GGAGG TGT AT GATG GGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4501 C C AT GC T C C T GAGGAGGAAAT C TGGGAGGAGC T GAG TGTGAT GGAGG TGT AT GATG GGAG 4560 

Qy 4 561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4620 

Qy 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

Qy 4 681 C C AAGGGC CC T C GC TGAAAC C AGC TAT G T GAAAGT C C T T GAGT AT GT G AT C AAGGT C AGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 4 681 C C AAGGGC C C T C GC TGAAAC C AGC TAT G TGAAAG T C C T T GAGT AT GT GATC AAGGT C AGT 4740 
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Qy 4741 GC AAGAGT T CGCTTTTTCTTCC C ATC C C TGC GT GAAGC AGC T T T GAGAGAGG AGGAAGAG 4800 

I I I I I I t I I I I I II I I I I I I I I I I M I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAGT TC GC TTTTTCTTCC CATC C C TGCGTGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 48 60 

I I I M I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

I I I I I I I I I I I I I I I II I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

Qy 4921 GAAGAGAGC GG TC AG TGTT C T C AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T TGGAGAT T 4980 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGC GG T C AG T GTT C T C AG TAGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 T TC AGCATCCAAGT T TATGAATGACAGC AGTC ACAC AGT TC TGTGTATATAG T T TAAGGG 5100 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 T AAGAGT C TTGTGTTT TAT T C AGAT T GGGAAAT C C AT TC TAT T T T G T GAATT GGGAT AAT 5160 

Qy 5161 AAC AGCAGTGGAATAAGTACT TAGAAAT GTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGCAGTGGAATAAGTAC T TAGAAAT GTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AATTC T T GC C T TAT AC C T C AG T C TAT T C T G TAAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AAT T C T T GC C T TAT AC C T C AGT C TAT T C T G TAAA 5280 

Qy 5281 AT T TT T AAAGAT ATAT GC AT AC C T GGAT TTCCTTGGCTTCTTT GAGAATGT AAGAGAAAT 5340 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 5281 AT T TT TAAAGAT AT ATGC AT AC C T GGAT TTCCTTGGCTTCTTT GAGAATGT AAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 54 01 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I M II I I I I II I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I [ I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C TAAAGAT G T AGGGAAAAG T GAGAGAGGGG T GAG GGT GT GGGGC T C C GGG TGAGAGT G 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 5521 C TC TAAAGAT G TAGGGAAAAGT GAGAGAGGGG T GAGGGTGT GGGGC T C C GGG T GAG AG T G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 
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5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 
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US-09-583-848A-8 

Query Match 100.0%; Score 5674; DB 3; Length 5674; 
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1 1 


Best Local Similarity 100.0%; Pred. No. 0; 

Matches 567 4; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I t I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 C TC TC AAC CC AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC TGAC T T GAGC AT TAGT GG 180 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I 
Db 121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

Qy 181 TTAGAGAGAAGCGAGGTTTTCGGTCTGAGGGGCGGCTTGAGATCGGTGGAGGGAAGCGGG 240 

I I I I I I I I. I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 181 TT AGAGAGAAGC GAGGT T T TC GGT C T GAGGGGC GGC T T GAGATC GGTGGAGGGAAGC GGG 240 

Qy 241 CC C AGC T C T G T AAGGAGGC AAGGT GAC ATGC T GAGG GAGGAC TGAGGAC C C AC T T AC C CC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CC C AGC T C T GT AAGGAGGC AAGGT GAC ATGC T GAGG GAGGAC T GAGGAC C C AC T T AC C CC 300 

Qy 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AGAT AGAGGAC C C C AAAT AATC C C T T CAT GC C AGT C C T GGAC CATC T GGT GG TGGAC T TC 360 

Qy 361 TC AGGC T GGGC C AC C C CC AGC CCCCTTGCTGCT TAAAC C AC T GG GGAC TC GAAGT C AGAG 420 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 CTCCGTGT GAT C AGGGAAGGGC T GC T T AGGAG AGGGC AGC G T C C AGGC T C T G C C AGAC AT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 4 81 CATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAAC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CAT GC T C AGGAT TC T C AAGGAGGGC TGAGGGT C C C T AAGAC C C C AC T C C C G T GAC C C AAC 54 0 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 C C AGGAAAC AT C C GGGTGC C C GGATGT GAC GC CAC T GAC T T GC G CAT T GTGGGGC AGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 
Db 721 C C AGGAAAC AT C C GGGTGC C C GGATGT GAC GC C ACT GAC TTGCGC ATT GTGGGGC AGAGA 780 

Qy 781 GAAGC GAGGT T T C CAT T C T GAGGGACGG C GT AGAG T TC GGC C GAAGGAAC C T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I II I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGGT T TC C AT T C T GAGGGACGGC GT AGAGT TC GGC C GAAGGAAC C T GAC C C AGG 840 

Qy 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I 


http://es/ScoreAccessWeb/GetItem. action? Appld=088 1 9669&seqld=6095 1 8&ItemName=us. . . 8/30/06 


Db 841 C T C TGTGAGGAGGC AAGGT GAGAGGC TGAGGGAGGAC TGAGGAC C C C GC C AC TC C AAAT A 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 C GT C TC AGCC T GGGC T GC C CC C AGAC C C C TGC T C C AAAAGC C T T GAGAGAC ACC AGGT TC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 961 CGT C TC AGCC T GGGC T GC C C C C AG AC C C C T GC TC C AAAAGC C T T GAGAGAC ACC AGGT TC 1020 

Qy 1021 T TC T C C C C AAGC T C T GGAAT C AGAGGT T GC TG TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I 
Db 1021 T TC T C C C C AAGC TC T GGAATC AGAGGT T GC TG TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I M I I I I I I I I I I I I I I II II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

IE I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 TGAAC C T CAC AGATC TGAGAGAAGC C AGG T TC AT T T AAT GG T T C TGAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 14 41 TGAAC C T C AC AGAT C T GAGAGAAG C C AGGT T C ATT T AAT GGT T C TGAGGGGC GGC T T GAG 1500 

Qy 1501 AT C CAC T GAGGGGAGT GGT T T T AGGC T C T GT GAGGAGGC AAGG T GAGATGC T GAGGGAGG 1560 

I I I I I I I 1 I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1501 AT C CAC T GAGGGGAGTGGT T T T AGGC T C T G TGAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT C C AGT AC CAC C C C T GC TG 1620 

I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT C C AGT AC CAC C C C T GC TG 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGT C AGGAGAGGC AGGGCC C AGGC AT C AAGG T C C AG CAT C CGC C C GGC AT T AGGGT C AGG 1800 

I II I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 
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Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCT^CCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

II I II I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGGTCTGATGGAGGGAAGGGGC TT GAAC AGGGCCTC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1981 GGGTCTGATGGAGGGAAGGGGC T T GAAC AGGGCCTC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

Qy 2041 TGCGAGATGAGGGAGGCC T CAGAGGACC CAGC ACCC TAGGACAC CGC ACCC C TGTC TGAG 2100 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 TGCGAGATGAGGGAGGCC T CAGAGGACC CAGC ACCC TAGGACAC CGCACCCC TGTC TGAG 2100 

Qy 2101 AC TGAGGC T GC C AC T TC T GGC C TC AAGAAT C AGAAC GATGGGGAC T C AGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC TGAGGC T GC C AC T T C T GGC C TC AAGAAT C AGAAC GAT GGGGAC T C AGAT T GC AT GGGG 2160 

Qy 2161 GT GGGAC C C AGGC C T GC AAGGC T TAC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2161 GTGGGAC CCAGGC C T GCAAGGC T T ACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGACC T T 2220 

Qy 2221 GGAATC C AGAT C AGT G TGGAC C T C GGC C C T GAGAGGT C C AGGGC AC GG T GGC C AC AT AT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

Qy 2281 GC C CAT AT T T C C T GC ATC T T T GAG G T GAC AGGAC AGAGC T GT GG T C T GAGAAGT GGGGC C 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCC CAT ATT TCCTGCATCTTTGAGGTGAC AGGAC AG AGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TC AGGT C AAC AGAGGGAGGAGT T C C AGGAT C CAT AT GGC C C AAGAT GT GC C C C C T T CAT G 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 TCAGGT C AAC AGAGGGAGGAGT T C C AGGAT C CAT AT GGC C C AAGATGT GC C C C C T T CAT G 2400 

Qy 2401 AGGAC T GGGGATATC C C C GGC T C AGAAAGAAGGGAC T C C AC AC AGTC TGGCTGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGGAC TGGGGATATCCCCGGCTC AGAAAGAAGGGAC TCC AC AC AGTC TGGCTGTCCCCTT 2460 

Qy 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I 
Db 2 521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2 580 

Qy 2581 AC T C AT GTC AG GGAAT T GG GGG T T GAGGAAGC AC AGGC GC T GGC AGGAATAAAGAT GAGT 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AC T C AT GTC AGGGAAT TGGGGGT T GAGGAAGC AC AGGC GC T GGC AGGAATAAAGAT GAGT 2640 

Qy 2 641 GAGAC AG AC AAGGC TATTGGAATCC AC ACCCCAGAACCAAAGGGGTCAGCCC TGGAC ACC 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 641 GAGAC AG AC AAGGC TAT T GGAATC C AC AC C C C AGAAC C AAAGGGGT C AGC C C T GGAC AC C 2700 
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Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I f I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 27 61 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

Qy 2881 GAC C AGAAC AC T GAGGGAGAC TGC AC AGAAAT C AGC CCTGCCCCTGC T GT C AC C C C AGAG 2940 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 2881 GAC C AGAAC AC T GAGGGAGAC T GC AC AGAAAT C AGC CCTGCCCCT GC T GT C AC C C C AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 AC GGGGAGGC C T TGGTC TGAGAAG GC T GC GC T C AGGT C AG T AGAGGGAGC GT C C C AGGC C 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C TGC C AGGAGT C AAGGTGAGGAC C AAGC GGGC ACC T C AC C CAGGAC AC AT T AAT T C C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 C TGC C AGGAG T C AAGGTGAGGAC C AAGC GGGC ACC T C AC C CAGGAC AC AT T AAT T C C AAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 AC C AGC AAAAGGGC AGGAT C C AGG C C C T GC C AGGAAAAAT AT AAGGGC C C T G C GT G AGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 33 61 GTAGC AC T GAG AAGC C AGGGC T G T GC T T GC GG T C T GC AC C C T GAGGGC C C GT GGAT T C C T 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3361 GTAGC AC T GAG AAGC CAGGGC T GT GC T T GC GG T C T GC AC C C T GAGGGC C C GT GGAT T C C T 3420 

Qy 3421 C T T C C T GGAGC T C C AGGAAC C AGGCAGT GAGGC C T T GGT C T GAG AC AG TAT C C T C AGG T C 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGC C C C AC C T GC C AC AGGAC AC AT AGG AC TC C AC AGAGT C TGG C C T C AC C T C C C T AC T G 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 
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1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T TCAGGTT T TCAGGGGACAGGCCAAC CCAGAGGAC AGGAT TC CC TGGAGGCCAC AGAG 3720 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3661 CC T TCAGGTTT TCAGGGGACAGGCCAAC CCAGAGGAC AGGAT TC CC TGGAGGCCAC AGAG 3720 

Qy 3721 GAGCACCAAGGAGAAGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTC 3780 

II I I I I I I I I I I I II II I I II I I I I I I I I I I I M M II I I I I I I I I II I I I I I I I I I M I 

Db 3721 GAGC AC C AAGG AGAAGAT C T GTAAGT AGGC C T T TGT T AGAG T C T CC AAGGT T C AGT T C TC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 CC T GC CC AC AC TC C T GC C T GC T GC C C T GAC GAGAGT C AT C ATG T C TC T T GAG C AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 
Db 3841 C C T GC C C AC AC TC C T GC C T GC T GC C C T GAC GAGAGT CATC ATGT C T C T T GAGC AGAGGAG 3900 

Qy 3901 TC T GC AC TGC AAGC C TGAG GAAGC C C T T GAGGC CC AAC AAGAGGCC C T GGGC C T GGT GT G 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 TC T GCAC TGC AAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGGCC C T GGGC C T GGT GT G 3960 

Qy 39 61 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I 
Db 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

Qy 4081 CAT C AAC T T C AC T C GAC AG AGGC AAC C C AG T GAGGG T T C C AGC AGC C GT GAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT C AAC T T C AC T C GAC AG AGGC AAC C C AGT GAGGG T T C C AGC AGC C GT GAAGAGGAGGG 4140 

Qy 4141 GC C AAGC AC C T C T T GT AT C C TGGAGT C C T T GT T CC GAGC AG T AAT C AC T AAGAAGG T GGC 4200 

I I II I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I E I I I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 42 61 AAT GC T GGAGAG TG TC AT C AAAAAT T AC AAGC AC TGTTTTCC TGAGATC T T C GGC AAAGC 4320 

I I I I I II I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 61 AAT GC T GGAGAG T GT CAT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I IE I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GAT CATGCCCAAGAC AGGC TTCCTGAT AAT TGTCCTGGTCATGAT TGC AATGGAGGGCGG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GAT C ATGC C C AAGAC AGGC T TC C T GAT AAT TG T C C T GGT CAT GAT T GC AATGGAGGGC GG 4500 

Qy 4501 C C ATGC T C C TGAGGAGGAAAT C TGGGAGGAGC T GAG T GTGAT GGAGGT GT AT GAT GGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 4501 CCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAG 4560 

Qy 4561 GGAGCAC AGTGCC TATGGGGAGCC CAGGAAGC TGC TCACCCAAGATT TGGTGCAGGAAAA 4620 

I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4561 GGAGCACAGTGCC TATGGGGAGCC CAGGAAGC TGC TCACCCAAGATT TGGTGCAGGAAAA 4 620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I 
Db 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 4741 GC AAGAG TTCGCTTTTTCTT C CC AT CC C T GC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I M I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCTT C CC AT CC C T GC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

Qy 4 921 GAAGAGAGC GG TC AG T GT T C T C AG TAGT AGGT TTCTGTTC TAT T GGGT GAC T TGGAGAT T 4 980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 4 921 GAAGAGAGC GG TC AGT GT T C T C AG TAGT AGGT TTCTGTTC TAT T GGGT GAC T TGGAGAT T 4 980 

Qy 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I 
Db 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 T T C AGC AT C C AAGT T TAT G AATGACAGC AG TC AC AC AGT T C T GT GTAT ATAG T T TAAGGG 5100 

Qy 5101 T AAGAG TCTTGTGTTT TAT T C AGAT T GGGAAATC C AT T C TAT T T T G T G AAT T GGG AT AAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I 
Db 5101 T AAGAG TCTTGTGTTT TAT T C AGAT TGGGAAATCC ATTC TAT T T TGT GAAT T GGGAT AAT 5160 

Qy 5161 AAC AGCAGTGGAATAAGTAC T TAGAAAT GTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 5161 AAC AGCAGTGGAATAAGTAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG TC AAT TC T T GC C T TAT AC C T C AGT C TAT T C TG T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC TAAAGAAAT T AAGAGAT AG TC AAT T C T TGC C TT AT AC C T C AGT C TAT TC T G T AAA 5280 

Qy 5281 AT T T T T AAAGAT AT AT GC AT AC C T GGAT T T C C T T GGC T T C T T T GAGAAT GT AAGAG AAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T TT TAAAGAT AT AT GC ATAC C T GGAT T TC C T T GGC T T C T T TGAGAATGT AAGAG AAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 


http://es/ScoreAccessWeb/GetItem .action? Appld=088 1 9669&seqld=6095 1 8&ItemName=us.. 


1 1 


Qy 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C TC T AAAGATG T AGGGAAAAGT GAGAGAGGGG T GAGGGT G TGGGGC T CC GGG T GAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II 
Db 5521 C TC T AAAGATG TAGGGAAAAGT GAGAGAGGGG T GAGGGT G T GGGGC TC C GGG T GAGAGT G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGC TGGGGC AT TTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 


J. Craig et al. 
POLYMORPHISMS IN KNOWN GENES ASSOCIATED 
WITH HUMAN DISEASE , METHODS OF DETECTION AND USES THEREOF 


RESULT 13 

US-09-949-016-12445 

Sequence 12445, Application US/09949016 
Patent No. 6812339 
GENERAL INFORMATION: 
APPLICANT: VENTER, 
TITLE OF INVENTION 
TITLE OF INVENTION 
FILE REFERENCE: CL001307 

CURRENT APPLICATION NUMBER: US/09/949,016 
CURRENT FILING DATE: 2000-04-14 
PRIOR APPLICATION NUMBER: 60/241,755 
PRIOR FILING DATE: 2000-10-20 
PRIOR APPLICATION NUMBER: 60/237,768 
PRIOR FILING DATE: 2000-10-03 
PRIOR APPLICATION NUMBER: 60/231,498 
PRIOR FILING DATE: 2000-09-08 
NUMBER OF SEQ ID NOS : 207012 
SOFTWARE : FastSEQ for Windows Version 
SEQ ID NO 12445 
LENGTH: 5 699 
TYPE: DNA 
ORGANISM: Human 
US-09-949-016-12445 


4.0 


Query Match 69.3%; 
Best Local Similarity 99.8%; 
Matches 4002; Conservative 


Score 3934.8; 
Pred. No. 0; 
0; Mismatches 


DB 3; Length 569 9; 


2; Indels 


6; Gaps 


6; 


Qy 


Db 


1669 CC C GT C C C GT C CC AC T GC C AC T T AACC C AC AGGGC AAT C T GT AG T C AT AGC T TAT G T GAC 1728 
I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I - 
1 CCCGTCCCGTCCCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGAC 60 


Qy 

Db 

Qy 

Db 

Qy 


172 9 CGGGGCAGGGTTGGTCAGGAGA-GGCAGGGCCCAGGCATCAAGGTCCA-GCATCCGCCCG 1786 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CGGGGCAGGGT TGGTCAGGAGAGGGCAGGGCC CAGGCATC AAGGTCCAGGCATCCGCCCG 120 

1787 GCATTAGGGTCAGGACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCA 184 6 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 
121 GCATTAGGGTCAGGACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCA 180 

1847 TCTCCACCGCCACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGT 1906 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I II I I I I I I I I I I I 
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Db 181 TCTCCACCGCCACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGT 240 

Qy 1907 CAGAATCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTT 1966 

I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CAGAATCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTT 300 

Qy 1967 GACGTCCCCATCCAGGGTCTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAG 2026 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I 
Db 301 GAC GTCC CCAT CCAGGG- C TGAT GGAGGGAAGGGGC T TGAACAGGGCC TCAGGGGAGCAG 359 

Qy 2027 AGGGAGGGC CC TAC T GC GAGATGAGGGAGGCC TC AGAGGAC C C AGC AC C C T AGGAC AC C G 2086 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 AGGGAGGGCCC TAC T GC GAGATGAGGGAGGCC TCAGAGGACCC AGCAC C C TAGGAC ACCG 419 

Qy 2087 C AC CCCTGTCT GAG AC TGAGGC TGC C AC T TC T GGC C TC AAGAAT C AGAAC GATGGGGAC T 2146 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 C AC CCCTGTCT GAGAC TGAGGC T GC C AC T T C T GGC C TC AAGAAT C AGAAT GAT GGGGAC T 47 9 

Qy 2147 CAGATT-GCATGGGGGTGGGACCCAGGCCTGCAAGGCTTACGCGGAGGAAGAGGAGGGAG 2205 

MINI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 480 CAGATTAGCATGGGGGTGGGACCCAGGC C TGCAAGGCTTACGCGGAGGAAGAGGAGGGAG 539 

Qy 2206 GAC T C AGGGGAC C T T GGAAT C C AGATC AGTGT GGAC C T C GGC C C TGAGAGGT C C AGGGCA 22 65 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 540 GAC T C AGGGGAC C T T GGAAT C C AGATC AGTGT GGAC C T C G GC C C TGAGAGGT C C AGGGCA 599 

Qy 2266 C GG T GGC C AC AT ATG GC CC AT AT T TCC T GC AT C T T T GAGG T GAC AGGAC AGAGC T G T GGT 2325 

I I I I I I I I I I I I I I II I I I I I I I I I N I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 600 C GG T GGC C AC AT ATGGC CC AT AT T TCC T GC AT C T T T GAGG T GAC AGGAC AGAGC T G T GGT 659 

Qy 2326 CTGAGAAGTGGGGCCTCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGA 2385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 660 CTGAGAAGTGGGGCCTCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGA 719 

Qy 2 38 6 TGTGCCCCCTT CAT G AGGAC T GGG GAT AT CCCCGGCT C AG AAAG AAGG GAC T C C AC AC AG 2 44 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 720 T GT GCCC C C T T CAT G AGGAC TGGG GATAT C CC C GGC TC AGAAAGAAGGGAC T C C AC AC AG 779 

Qy 244 6 TCTGGCTGTCCCCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCA 2 505 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 780 TCTGGCTGTCCCCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCA 839 

Qy 2506 TTCTCACTTGTACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGT 2565 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I II I I I I I I 
Db 84 0 TTCTCACTTGTACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGT 899 

Qy 2566 AAAGGGGGGATGTCTACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCA 2 625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 900 AAAGGGGGGATGTCTACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCA 959 

Qy 2 62 6 GGAATAAAGATGAGT GAGAC AGACAAGGC TAT TGGAATCC AC AC CCC AGAAC CAAAGGGG 2 685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 960 GGAAT AAAGAT GAGT GAGAC AGACAAGGC TAT T GGAAT C C T C AC C C C AGAAC CAAAGGGG 1019 

Qy 2 686 TCAGCCCTGGACACCTCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGG 2745 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1020 TCAGCCCTGGACACCTCACCCAGGATGTGGCTTC-TTTTCACTCCTGTTTCCAGATCTGG 107 8 

Qy 274 6 GGC AGGT GAGGAC C T C ATT C T C AGAGGG TGAC TC AGGT C AAC GT AGGGAC CCC CAT C TGG 2805 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1079 GGCAGGTGAGGACCTCATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGG 1138 
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Qy 2806 TC T AAAGAC AG AGC GG TC C C AGGAT C T GCC AT GC GT T C GGGT GAGGAAC ATGAGGG AGGA 2865 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1139 T C T AAAGAC AG AGCGG T C C C AGGAT C T G CC AT GCGT T C GGGTGAGGAAC ATGAGGG AGGA 1198 

Qy 2866 C TGAGGG TAC C CC AGGAC C AGAAC AC TG AGGGAGAC T GC AC AGAAATC AGC CCTGCCCCT 2925 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I t I I I I 
Db 1199 C T GAGGG TAC C CCAGGACC AGAAC AC TGAGGG AG AC T GC AC AGAAATC AGC CCTGCCCCT 1258 

Qy 2926 GCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGA 2 985 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1259 GCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGA 1318 

Qy 2986 TCATTGATGTCAGGGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAG 3045 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1319 TCATTGATGTCAGGGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAG 1378 

Qy 3046 GGAGCGT C CCAGGCC C TGC C AGGAGTCAAGGT GAGGACCAAGCGGGCACC TC ACCC AGGA 3105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 137 9 GGAGC GT CC CAGGC C C T GC C AGGAGTC AAGG T GAGGAC C AAGC GGGC ACC T C AC C C AGGA 14 38 

Qy 3106 C AC AT TAAT TC C AAT GAAT TT TGAT ATC TCTTGCTGCCCTTCCC C AAGGAC C T AGGC AC G 3165 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1439 CACATTAATTCCAATGAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACG 14 98 

Qy 3166 TGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTG 3225 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I 
Db 1499 TGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTG 1558 

Qy 3226 ATTTGGATTTCTCAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAG 3285 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1559 AT T TGGAT T T C T C AG ACC AGC AAAAGGG C AGGAT C CAGGC C C T G C C AG GAAAAAT ATAAG 1618 

Qy 3286 GGCCCTGCGTGAGAACAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTC 3345 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 1 I I I I I I I I I 
Db 1619 GGCCCTGCGTGAGAACAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTC 1678 

Qy 3346 CAGCCC ACCC TCCTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTC TGC ACC CTGAG 3405 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1679 CAGCCCACCCTCC TGGTAGCACTGAGAAGCCAGGGC TGTGCTTGCGGTC TGC ACCC TGAG 1738 

Qy 34 06 GGCCCGTGGATTCCTCTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGA 34 65 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1739 GGCCCGTGGATTCCTCTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGA 1798 

Qy 34 66 C AG TAT C C T C AGGT C AC AGAGC AGAGGAT GC AC AGGG T G T GC C AGC AG TGAAT GT T T GC C 3525 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1799 CAGTATCCTCAGGTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCC 1858 

Qy 352 6 C TGAATGCACACCAAGGGC CCCAC C TGC CACAGGAC ACAT AGGAC TCC ACAGAGTC TGGC 3585 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1859 C TGAATGCACACCAAGGGC CCCAC C TGC CACAGGAC ACAT AGGAC TCC ACAGAGTC TGGC 1918 

Qy 3586 CTCACCTCCCTACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGT 3645 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1919 CTCACCTCCCTACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGT 1978 

Qy 3646 AC C C TC T C AC TTCCTCCTT C AGGT T T TC AGGGGAC AGGC C AAC C CAGAGGAC AGGAT TCC 3705 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1979 AC C C T C T C AC TTCCTCCTT C AGGT T T T C AGGG GAC AGGC C AAC C CAGAGGAC AGGAT TCC 2038 
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Qy 3706 C TG GAGGC C AC AGAGGAGC ACC AAGGAG AAGAT C TG T AAG T AGGC C TT TGT T AGAG T C TC 3765 

I I I I I I I I I I I I I I I I I I I I I i I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I 

Db 2039 C TGGAGGC C AC AGAGGAGC ACC AAGGAG AAGAT C T G T AAG T AGGC C TT TGT T AGAG TC TC 2098 

Qy 3766 CAAGGTTCAGTTCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGT 3825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2099 CAAGGTTCAGTTCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGT 2158 

Qy 3826 CTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTC 3885 

I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2159 CTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTC 2218 

Qy 388 6 TC T TGAG C AGAGGAG TC TG C AC T GC AAGC C TGAGGAAGCC C T T GAGGC C CAAC AAG AGGC 3945 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I 

Db 2219 TC T TGAGC AGAGGAG T C TG C AC TGCAAGCC TGAGGAAGCC C T T GAGGC C CAAC AAG AGGC 2278 

Qy 3946 CCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCAC 4005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 2279 CCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCAC 2338 

Qy 4006 C C T GGAGGAGG T GC C C AC T GC T GGGTC AAC AGAT C C T C CC C AGAGT C C T C AGGGAGC C T C 4065 

I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2339 C C T GGAGGAGG T GC C C AC T GC T GGGTC AAC AG AT C C TC CC C AGAGT C C T C AGGGAGC C T C 2398 

Qy 4066 C GC C TT T C C C AC T AC CAT C AAC T T C AC T C GAC AGAGGC AAC C C AGT GAGGGT T C C AGCAG 4125 

I I I II I I I I II I I I I I II I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

Db 2399 CGCCTTTCCCACTAC CATC AAC TTCACTCGACAGAGGCAACCCAGTGAGGGTTCCAGCAG 2458 

Qy 4126 C C G T GAAGAGG AGGGGC C AAGC AC C TC T TGT AT C C T GGAG TCCTTGTTCC GAGC AG TAAT 4185 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2459 C C G T GAAGAGG AGGGGC C AAGC AC C TC T TGT AT C C T GGAG TCCTTGTTCC GAGC AG TAAT 2518 

Qy 4186 CACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCC 4245 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2519 CACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCC 2578 

Qy 4246 AG T C AC AAAGGC AGAAAT GC T GGAGAGT GTC AT C AAAAAT T AC AAGC AC TGTTTTCCT GA 4305 

I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2579 AGT C AC AAAGG C AGAAAT GC T GGAGAG T GTC AT C AAAAAT T AC AAGC AC TGTTTTCCT GA 2638 

Qy 4 306 GATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGC 4365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 639 GATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGC 2 698 

Qy 4366 AGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCT 4425 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2699 AGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCT 2758 

Qy 442 6 GCTGGGT GAT AATCAGATCATGCCCAAGAC AGGC TTCCTGATAATTGTCCTGGTCATGAT 4 485 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 2759 GCTGGGTGATAATCAGATCATGCCCAAGACAGGC TTCCTGATAATTGTCCTGGTCATGAT 2818 

Qy 4486 TGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGA 4545 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2819 TGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGA 2878 

Qy 4 54 6 GGTGTAT GATGGGAGGGAGC ACAG TGCC TATGGGGAGCCC AGGAAGCT GC TC ACCC AAGA 4 605 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2879 GGT GTAT GATGGGAGGGAGC AC AG TGCC TATGGGGAGCCC AGGAAGCT GC TC ACCC AAGA 2938 

Qy 4 606 TTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCACGCTA 4 664 
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I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I It I I I I I I I I I I I I I 
Db 2939 TTTGGTGCAGGAAAAGTACCTGGAGTACCGGCAGGTGCCGGACAGTGATCCCGCACGCTA 2998 

Qy 4 665 TGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTA 4724 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2999 TGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTA 3058 

Qy 4725 TGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTT 4784 

I I I I I I I M I I I I I I I I I I I I I I I I M M I I I I I I II I II I I I I I I I I I I II I I I I I I I I 
Db 3059 TGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTT 3118 

Qy 4 785 GAG AGAGGAGGAAGAGGGAGTC TGAGC ATGAG T TGC AGC C AAGGC C AG TGGG AGGGGGAC 4844 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3119 GAGAGAGGAGG AAGAGGGAGT C TGAGC ATGAGT T GC AGC C AAGGC C AG T GGG AGGGGGAC 3178 

Qy 4845 TGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAG 4904 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 317 9 TGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAG 3238 

Qy 4 905 GCCCATTCTTCACTCTGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATT 4 964 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3239 GCCCATTCTTCACTCTGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATT 3298 

Qy 4 965 GGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAG 5024 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3299 GGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAG 3358 

Qy 5025 GGATGGTTGAATGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGT 5084 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3359 GGATGGTTGAATGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGT 3418 

Qy 508 5 GTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTT 514 4 

I I I I I I I I I I 1 I I I I I M I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 3419 GTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTT 3478 

Qy 5145 TGTGAAT TGGGATAATAACAGCAGTGGAATAAGTAC TTAGAAATGTGAAAAATGAGCAGT 5204 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 34 7 9 TGTGAAT TGGGATAATAACAGCAGTGGAATAAGTAC T TAGAAATGTGAAAAATGAGCAGT 3538 

Qy 5205 AAAAT AGAT GAGATAAAGAAC T AAAGAAAT T AAGAG ATAG T C AAT TC T T GC C T TAT AC C T 5264 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3539 AAAAT AGAT GAGATAAAGAAC T AAAGAAAT T AAGAG AT AG TC AAT TC T T GC C T TAT AC C T 3598 

Qy 5265 CAGTCTATTCTGTAAAATTTTTAAAGATATATGCATACCTGGATTTCCTTGGCTTCTTTG 5324 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3599 CAGTCTATTCTGTAAAATTTTTAAAGATATATGCATACCTGGATTTCCTTGGCTTCTTTG 3658 

Qy 5325 AGAATGTAAGAGAAAT TAAATC TGAATAAAGAAT TC T TC C TGT T CAC T GGC TCTTTTCTT 5384 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I | | | | | | | | | | 
Db 3659 AGAATGTAAGAGAAAT TAAATC TGAATAAAGAAT TC T TCC TGT T CAC TGGC TCTTTTCTT 3718 

Qy 5385 CTCCATGCAC TGAGC ATCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGG 5444 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3719 CTCCATGCAC TGAGCATCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGG 3778 

Qy 5445 TAAGCCAGACTCATACCCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATC 5504 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3779 TAAGC C AGAC T CAT AC C C ACC C AT AGGG TC GT AGAG T C T AGGAGC TGC AGT C AC GT AAT C 3838 

Qy 5505 GAG GTGGCAAGATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTG TGGG 5564 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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1 1 


Db 3839 GAGGTGGCAAGATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGG 3898 

Qy 5565 GCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGA 5624 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I 1 I I I II I I I I I 
Db 38 99 GCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGA 3958 

Qy 5625 AACTGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3959 AACTGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 4008 


RESULT 14 

US-09-949-016-14430 

Sequence 14430, Application US/09949016 
Patent No. 6812339 
GENERAL INFORMATION : 
APPLICANT: VENTER, J. Craig et al. 

TITLE OF INVENTION: POLYMORPHISMS IN KNOWN GENES ASSOCIATED 

TITLE OF INVENTION: WITH HUMAN DISEASE, METHODS OF DETECTION AND USES THEREOF 
FILE REFERENCE: CL001307 

CURRENT APPLICATION NUMBER: US/09/949,016 
CURRENT FILING DATE: 2000-04-14 
PRIOR APPLICATION NUMBER: 60/241,755 
PRIOR FILING DATE: 2000-10-20 
PRIOR APPLICATION NUMBER: 60/237,768 
PRIOR FILING DATE: 2000-10-03 
PRIOR APPLICATION NUMBER: 60/231,498 
PRIOR FILING DATE: 2000-09-08 
NUMBER OF SEQ ID NOS : 207012 
SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 14430 
LENGTH: 5 699 
TYPE : DNA 
ORGANISM: Human 
US-09-949-016-14430 

Query Match 69.3%; Score 3934.8; DB 3; Length 5699; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 4002; Conservative 0; Mismatches 2; Indels 6; Gaps 6; 

Qy 1669 CCCGTCCCGTCC C AC TGCC AC T T AACC C AC AGGGC AATC T G TAG T C AT AGC T TAT G T GAC 1728 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 
Db 1 CCCGTCCCGTCCCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGAC 60 

Qy 172 9 CGGGGCAGGGTTGGTCAGGAGA-GGCAGGGCCCAGGCATCAAGGTCCA-GCATCCGCCCG 178 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 CGGGGCAGGGTTGGTCAGGAGAGGGCAGGGCCCAGGCATCAAGGTCCAGGCATCCGCCCG 120 

Qy 1787 GCATTAGGGTCAGGACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCA 184 6 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GC AT T AGGGT C AGGAC C C T GGGAGGGAAC T GAGGGT TC C C C AC C C AC AC C TG T C TC C TCA 180 

Qy 1847 TCTCCACCGCCACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGT 1906 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TCTCCACCGCCACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGT 240 

Qy 1907 CAGAATCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTT 1966 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I 
Db 241 CAGAATCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTT 300 

Qy 1967 GACGTCCCCATCCAGGGTC TGATGGAGGGAAGGGGC TTGAACAGGGCC TCAGGGGAGCAG 202 6 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 301 GACGTCCCCATCCAGGG-CTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAG 359 

Qy 2027 AGGGAGGGCCC TAC TGCGAGATGAGGGAGGCC TC AGAGGACCCAGCACCC TAGGAC AC CG 2086 

I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I 
Db 360 AGGGAGGGCCC TAC TGCGAGATGAGGGAGGCC TC AGAGGACCCAGCACCC TAGGAC AC CG 419 

Qy 2087 C AC CC C T GTC T GAGAC T GAGGC T GC C AC T T C T GGC C TC AAGAAT C AGAAC GATGGGGAC T 214 6 

I I I I I I I I I I I I I I I I I I I I I E I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 C AC CC C T GTC T GAGAC T GAGGC T GC C AC T T C T GGC C TC AAGAAT C AGAAT GAT GGGGAC T 479 

Qy 2147 C AGAT T - GC ATG GGGG T GGGAC C C AGGC C T GC AAGGC T TAC GC GGAGGAAGAGGAGGGAG 2205 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I 
Db 480 C AGAT T AGC AT GGGGGT GGGAC C C AGGC C T GC AAGGC T TACGC GGAGGAAGAGGAG GGAG 539 

Qy 2206 GAC TC AGGGGACCT TGGAATCC AGATCAGTGT GGAC CTCGGCC C TGAGAGGT C C AGGGCA 22 65 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I 
Db 540 GAC TC AGGGGAC C T TGGAATC C AGATC AGTG T GGAC C T C GGC C C T GAGAGGT C C AGGGCA 599 

Qy 2266 CGG TGGC C AC ATAT GGC C CAT AT T T CC T GCAT C T T T GAGG T GAC AGGAC AGAGC T G T GGT 2325 

I I I I II I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I 
Db 600 C GG TGGC C AC AT AT GGC C CAT AT T T CC T GCAT C T T T GAGGTGAC AGGAC AGAGC T G T GGT 659 

Qy 2326 CTGAGAAGTGGGGCCTCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGA 2385 

I I I I I I I I I I I I I I I E I I I I E I E I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I E 
Db 660 C T GAGAAGT GGGGC C T C AGGTC AAC AGAGGGAGGAG T T C C AGGAT C C AT AT GGC C C AAGA 719 

Qy 2386 TGT GC C C C C T T C ATGAGGAC T GGG GATATC C C C GGC T C AGAAAGAAGGGAC T C C AC AC AG 2445 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I ( I I I I I I I I I I I I I 
Db 720 TGTGCCCCCTT CAT GAGGAC T GGGGATATC C C C GGC T C AGAAAGAAGGGAC T C C AC AC AG 77 9 

Qy 244 6 TCTGGCTGTCCCCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCA 2505 

f I I I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I I I I I t I I I I E I I I I I I I I I I I I I I I I I 
Db 780 TCTGGCTGTCCCCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCA 839 

Qy 2506 TTCTCACTTGTACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGT 2565 

I I I I I ! I I I I I I I I I I I I I I I I E I I E I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I 
Db 840 TTCTCACTTGTACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGT 899 

Qy 2566 AAAGGGGGGAT GTC T AC TCATGTCAGGGAATT GGGGGT TGAGGAAGCACAGGCGC TGGC A 2625 

! I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I t I I I I E I I I I I I I I I E I I I I I f E 
Db 900 AAAGGGGGGATGTCT AC TCATGTCAGGGAATTGGGGGT TGAGGAAGCACAGGCGC TGGC A 959 

Qy 262 6 GGAATAAAGAT GAGT GAGAC AGAC AAGGC TAT TGGAAT CC AC AC C C C AGAAC C AAAGGGG 2685 

I I I t I I I I I I I I I I I 1 I I I I I I E I I t I I I I I I I I I t I I I E M E I I I I I I I I I I I I I I I I 
Db 960 GGAATAAAGAT GAG T GAGAC AGAC AAGGC TAT T GGAAT C C T C AC C C C AGAAC C AAAGGGG 1019 

Qy 268 6 TCAGCCCTGGACACCTCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGG 27 4 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I E I I 
Db 1020 TCAGCCCTGGACACCTCACCCAGGATGTGGCTTC-TTTTCACTCCTGTTTCCAGATCTGG 1078 

Qy 2746 GGC AGGTGAGGAC C T CAT T C T C AGAGGG TGAC T C AG GT C AAC GT AGGGAC CC C C AT C T GG 2805 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1079 GGC AGG T GAGGAC C T C ATT C T C AGAGGG TGAC T CAGGT C AAC GT AGGGAC CC C CAT C T GG 1138 

Qy 2806 TCTAAAGACAGAGCGGTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGA 2865 

I I I I I I I I I I j I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1139 TCTAAAGACAGAGCGGTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGA 1198 

Qy 2866 C TGAGGGTACC CCAGGACC AGAAC AC TGAGGGAGAC TGC ACAGAAATC AGCC C TGC CCC T 2925 

! I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1199 C TGAGGG TAC C C C AGGAC C AGAAC AC T GAGGGAGAC TGC AC AGAAATC AGC CC TGC C C C T 1258 

Qy 2926 GCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGA 2985 

I I I t I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1259 GCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGA 1318 

Qy 2986 TCATTGATGTCAGGGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAG 304 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1319 TCATTGATGTCAGGGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAG 1378 

Qy 304 6 GGAGCGTCCCAGGCCCTGCCAGGAGTCAAGGTGAGGACCAAGCGGGCACCTCACCCAGGA 3105 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1379 GGAGC GT C C C AGGC C C TGC C AGGAGT C AAGGT GAGGAC C AAGC GGGCACC T C AC C C AGGA 1438 

Qy 3106 C AC AT TAAT T C C AAT GAAT T T T GAT AT CTCTTGCTGCCCTTCCC C AAGGAC C T AGGC AC G 3165 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1439 C AC AT TAAT T C C AAT GAAT TT T GATATC TCTTGCTGCCCTTCCC C AAG GAC C T AGGC AC G 1498 

Qy 3166 TGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTG 3225 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1499 TGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTG 1558 

Qy 3226 AT T T GGAT T T C T C AGAC C AGC AAAAGGGC AGG AT C C AGGC C C T GC C AGGAAAAAT AT AAG 3285 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1559 AT T T GGAT T TC T C AGAC C AGC AAAAGGGC AGGAT C C AGGC C C T GCC AGGAAAAAT ATAAG 1618 

Qy 328 6 GGCCCTGCGTGAGAACAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTC 334 5 

I I I I I II I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1619 GGCCCTGCGTGAGAACAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTC 1678 

Qy 334 6 CAGCCCACCCTCCTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAG 3405 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1679 CAGCCCACCCTCCTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAG 1738 

Qy 3406 GGC C C GT GGAT TCCTCTTCCT GGAGC T C C AGGAAC C AGGC AGT GAGGC CTTGGTCT GAGA 34 65 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1739 GGC CCGT GGAT TCCTCTTCCTGGAGCTCCAGGAACC AGGC AGTGAGGCCTTGGTCTGAGA 1798 

Qy 3466 C AG TATC C T C AGG TC AC AG AGC AG AGGAT GC AC AGG GT GT GC C AGC AG TGAAT GT T T GC C 3525 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1799 CAGTATCCTCAGGTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCC 1858 

Qy 3526 C T GAATGC AC AC C AAGGGC CC C AC C T GC CAC AGGAC AC AT AGGAC TC C AC AG AGT C T GGC 3585 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1859 C T GAATGC AC AC C AAGGGC CC C AC C T GC CAC AGGAC AC AT AGGAC TC C AC AGAGT C T GGC 1918 

Qy 3586 CTCACCTCCCTACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGT 3645 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1919 CTCACCTCCCTACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGT 1978 

Qy 3646 AC C C TC T CAC TTCCTCCTT C AGGT T T TC AGGG GAC AGGC CAAC C CAGAGGAC AGGAT T C C 3705 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1979 AC C C T C T CAC TTCCTCCTT C AGGT T T TCAGGGGAC AGGC CAAC C CAGAGGAC AGGAT T C C 2038 

Qy 3706 C TGGAGG C C AC AGAG GAGC AC C AAGGAGAAGAT C T G TAAG T AGGC C T T TGT T AGAG TC TC 3765 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2039 C TG GAGGC CAC AGAG GAGC AC C AAGGAGAAGATC T G TAAG T AGGC C T T TGT TAG AG TC TC 2098 

Qy 3766 C AAGGT T C AGT T C TC AGC T GAGGC C TC T CAC AC AC TCCCTCTCTCCCC AGGC CTGTGGGT 3825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2099 CAAGGTTCAGTTCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGT 2158 
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Qy 3826 CTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTC 3885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2159 CTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTC 2218 

Qy 3886 TC T TGAGCAGAGGAG TC TGCAC TGCAAGCC TGAGGAAGCC C T TGAGGC CCAACAAGAGGC 3945 

I I I I I 1 1 I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I 
Db 2219 TC T TGAGCAGAGGAG TC TGCAC TG C AAGC C T GAGGAAGCC C T T G AGGC C C AAC AAGAGGC 2278 

Qy 3946 CCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCAC 4005 

I I I I I I I I I I I I I I I I I I I I I I I I I E I II I I I I I II I I I I I I I I I II I I I I I i I I I I I I I 
Db 2279 CCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCAC 2338 

Qy 4006 C C T GGAGGAGG T GC C C AC T GC TGGGT CAAC AGATC C T C CC C AGAG T CC T C AGGGAGC C TC 4065 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2339 C C T GGAGGAGG T GC C C AC T GC T GGGT CAAC AGATC C T C CC C AGAGT CC TC AGGGAGC C TC 2398 

Qy 4066 CGCCTTTCCCACTACCATCAACTTCACTCGACAGAGGCAACCCAGTGAGGGTTCCAGCAG 4125 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2399 CGCCTTTCCCACTAC CATC AAC TTCACTCGACAGAGGCAACCCAGTGAGGGTTCCAGCAG 2458 

Qy 4126 C C G TGAAGAGG AGGG GC C AAGCAC C TC T T GT ATC C T GGAG TCCTTGTTCC GAGC AG TAAT 4185 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2459 C C G TGAAGAGG AGGG GC C AAGC AC C TC T T GTATC C T GGAG TCCTTGTTCC GAGC AG TAAT 2518 

Qy 4186 CACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCC 4245 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2519 C AC TAAGAAGG T GGC T GAT T TGGT T GG TTTTCTGCTC C TC AAAT AT C GAGC C AGGG AGC C 2578 

Qy 4246 AGT CACAAAGGCAGAAATGC TGGAGAGT GTCATCAAAAAT T AC AAGC AC TGTT T TC C TGA 4305 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2579 AGT CACAAAGGCAGAAATGC TGGAGAGT GTCATCAAAAAT T AC AAGC AC TGTT T TC C TGA 2638 

Qy 4306 GATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGC 4365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2639 GATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGC 2698 

Qy 4366 AGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCT 4425 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2699 AGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCT 2758 

Qy 442 6 GCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGAT 4485 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2759 GCT GGGT GATAATC AGATC ATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGAT 2818 

Qy 448 6 TGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGA 454 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2819 TGC AAT GGAGG GCGGC C AT GCT CC T GAGGAGGAAAT C T GGGAGGAGC T GAGT GTGAT GGA 2878 

Qy 4546 GGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGA 4605 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2879 GGT GT AT GATGGGAGGGAGC AC AG T GC C TAT GGGGAGC CC AGGAAGC T GC TC AC C C AAGA 2938 

Qy 4 606 TTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCACGCTA 4 664 

I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2939 TTTGGTGCAGGAAAAGTACCTGGAGTACCGGCAGGTGCCGGACAGTGATCCCGCACGCTA 2998 

Qy 4665 TGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTA 4724 

I I I I I I I I I I I I I I 1 I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2999 TGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGC TATGTGAAAGTCCTTGAGTA 3058 
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Qy 4725 TGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTT 4784 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I 
Db 3059 TGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTT 3118 

Qy 4785 GAGAGAGGAGGAAGAGGGAGTC TGAGCATGAGT TGC AGCC AAGGCC AGTGGGAGGGGGAC 4844 

I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 3119 GAGAGAGGAGGAAGAGGGAGTC TGAGC AT GAG T TGC AGC C AAGG C C AG TGGGAGGGGGAC 3178 

Qy 484 5 TGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAG 4 904 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3179 TGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAG 3238 

Qy 4905 GCCCATTCTTCACTCTGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATT 4964 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 3239 GCCCATTCTTCACTCTGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATT 3298 

Qy 4 965 GGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAG 5024 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3299 GGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAG 3358 

Qy 5025 GGATGGTTGAATGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGT 5084 

I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3359 GGATGGTTGAATGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGT 3418 

Qy 5085 GTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTT 5144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3419 GTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTT 3478 

Qy 514 5 T GT GAAT TGGGAT AATAAC AGC AG TGGAAT AAG T AC T T AGAAAT GT GAAAAATGAG C AGT 5204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 347 9 TGTGAAT TGGG AT AATAAC AGC AG TGGAAT AAGT AC TTAGAAATGT GAAAAATGAG C AGT 3538 

Qy 5205 AAAAT AGAT GAGAT AAAGAAC TAAAGAAAT T AAGAG AT AG T C AAT T C T T GC C T TAT AC C T 52 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3539 AAAAT AG AT GAGAT AAAGAAC TAAAGAAAT T AAGAG AT AG T C AAT T C T T GC C T TAT AC C T 3598 

Qy 5265 CAGTCTATTCTGTAAAATTTTTAAAGATATATGCATACCTGGATTTCCTTGGCTTCTTTG 5324 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3599 CAGTCTATTCTGTAAAATTTTTAAAGATATATGCATACCTGGATTTCCTTGGCTTCTTTG 3658 

Qy 5325 AGAATGT AAGAGAAAT TAAAT C TGAAT AAAGAAT TCTTCCTGTT C AC TGGCTCTTTTCTT 5384 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3659 AGAATGT AAGAGAAAT TAAAT C TGAAT AAAGAAT TCTTCCTGTT C AC T GGC TC T T T T C T T 3718 

Qy 5385 C TC C ATGC AC TGAGC ATC TGC TTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCT AAGG 5444 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3719 CTCCATGCAC TGAGC ATC TGC TTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCT AAGG 3778 

Qy 544 5 T AAGC C AGAC T CAT AC C C AC C C AT AGGG T C G T AGAG T C T AGGAGC T GC AGTC AC GT AATC 5504 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 377 9 T AAGC C AGAC T CAT AC C CACC CAT AGGG T C G T AGAG T C TAGGAGC T GC AGT C AC GT AAT C 3838 

Qy 5505 GAGGTGGCAAGATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGG 5564 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3839 GAGGTGGCAAGATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGG 3898 

Qy 5565 GCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGA 5624 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3899 GCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGA 3958 

Qy 5625 AACTGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 
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1 1 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 f 1 1 1 1 1 1 E I 

Db 3959 AAC TGC AG TTCCTTCT GGGGGAGC TGAT TG TAAT GAT C TT GGGT GGAT C C 4008 


RESULT 15 
US-09-056-105-9 
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APPLICANT: KIPPS, THOMAS J. 
APPLICANT: WU, YUNQI 
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CURRENT FILING DATE: 1998-04-06 
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Query Match 46.8%; Score 2655; DB 3; Length 11495; 

Best Local Similarity 73.6%; Pred. No. 0; 

Matches 4231; Conservative 0; Mismatches 1100; Indels 416; Gaps 50; 

Qy 21 CCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCCATCCAAACATCTTCACGCTC 80 

I I I I I II II I I I I I I I I I I I I I I I 

Db 5969 CCAGCACCCCTATCCTCCCCAAACCCCCACTACCCTTATGTCCTCATCCCCCACCCCAAC 6028 

Qy 81 ACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTGCTCTCAACCCAGGGAAGC-C 13 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 602 9 ACCACTATCCCCATCCAGGTTGAATCGCATTCCGTTTCTGCTTTCAACCCAGGGAAGCTC 6088 

Qy 140 C AGGT GC C C AG ATGT GAC GC C AC T GAC T TGAGCAT T AGT GGTT AGAGAGAAGC GAGG T T T 199 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II 
Db 6089 CAGGT T C C T GG ATGT GAT GC C AGT GAC T TG T GCAT T GGGGGTT AGAGAGAC G C TAGC T T C 6148 

Qy 200 TCGGTCTGAGGGGCGGCTTGAGATCGGTGGAGGGAAGCGGGCCCA-GCTCTGTAAGGAGG 258 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 614 9 TCAGTCTGACAGGCAGCTTGGGATTGGCAGAGGGAAGCCGGTCCAGGCTCTGTGAGGTGG 6208 

Qy 259 CAAGGTGACATGCTGAGGGAGGACT GAGGACCCACTTACCCCAGATAGAGGACCCCA 315 

II I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 6209 C AT AGT GAGAAGC T GAGGGAGAAG T C GGGAGGC C C T C TC C ACC C C AGATAGAC GAC C C C A 62 68 

Qy 316 AATAATCC CTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTCTCAGGC 366 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I IE I I I I 

Db 62 69 AATAATCCGGCACCCCTCCTGCTTCCAGTCCTGGGCCACCCGTGGGCGGACTTCTGAGTC 6328 

Qy 367 TGG GCC AC C C C C AGC CCCCTTGCTGCT T AAAC C AC T GGGG AC TC GAAG T C AG AGC T C C GT 426 

I I I I I I I I I IIEI I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 6329 TGGGAC GCC C AC C AC CC C AC T GC C GC T G AAGC C GC AGGGAC T AT GGAG T C AGAGC T T GG T 6388 

Qy 427 GTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACATCATGCT 486 

I I I I I I I I I I I I I I I I II I I I I I IE I I I I I I I I I I I 

Db 6389 GTGATCAGTGCAGGACTGGTGGGGGT AGGCTCTGCCAGGCATCAACGT 6436 
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Qy 4 87 C AGGAT TC T C AAGGAGGGC TGAGGGTC C C T AAGAC C C C AC T C C CGTGACC C AAC CC C C AC 54 6 

I I I I I II I I I I II I I I I II I M I I I I I II III I I I I 
Db 64 37 C AGGAC C C T AGGAGAGGGC TGAGT GTC C C C C A CCCCCATTCCTATCCCCTACCCCTT 64 93 

Qy 547 TCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCACCCCAC 606 

I I I I I I I I I I I I III I I I I I 

Db 6494 TCCCATCTGCACTCCC TACCCCATCTGTACCCCC 6527 

Qy 607 ATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCTCACCCC 666 

I I I I I I I I I III III II II I I I I I I I I I I I I I I 

Db 6528 ATTCCCCACCTGTGCCCCTATCCTCCCCAACCCCCCAACCAGCCTCATACCCCCCTCCCC 6587 

Qy 667 CACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCG-GTTCCCGCCAGG 725 

I I II I I I I I II I I I I I I II I II III Mill 

Db 6588 CACCCCTACCTTCATCCCCATCAGTGCAGCATCCGGTTCCACCCCTGCTTTCAATCCAGG 6647 

Qy 726 AAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGAGAAGC 785 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I I I 
Db 6648 C AAGC C C T GGGT GGC C GGATGTGATGC C AC T GAC T T GT GAAT TG AGGGT T AGAGAGAAGT 6707 

Qy 78 6 GAGGT T TC C AT T C TG AGGGAC GGC GT AGAGT T CGGC C GAAGGAAC C T GAC C C AGGC T C TG 84 5 

I I I I I I I I I I I I III I III II I II II II II II I I I I I II I I I 

Db 6708 GAGTTTCTGGGTCTGAAGGGTGGC-TTGAGATCGGCAGAGGGAAGGTGGCCCAGGCTTTG 67 66 

Qy 84 6 TGAGGAGGCAAGGTGAGAGGC TGAGGGAGGAC TGAGGAC CCCGCCAC T CCAAATAGAGAG 905 

I I I I I I I M I I II I I I I I I I I I I I II I I I I I I IE I I II I I I I II I 
Db 67 67 TGAAGAGGCAAAGTGAGAC TC TGAGGGAGGAT TCAGGAAACCC C TATC CC TGATAGAGGG 682 6 

Qy 906 CCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGACGTCT 965 

I I II I III I II II III III 

Db 6827 TCCCAGCCCTGGACTACCC CGCGGAGGCTGACTTCT 6862 

Qy 966 C AGC C T GGGC T GC C C C C AGAC CC C T GC T C C AAAAGC C T TGAGAG AC AC C AGG TTCTTCTC 1025 

I I I If I I I I I I I I II I I I I I I II I II 

Db 68 63 CAGACTGGGCTGCTCCCCACCTCCGCCCCC TTCGCAACGCGTTTGTTTAAGCCAC 6917 

Qy 1026 C C C AAGC T C T GGAAT C AGAGGT T GC T GT GAC CAGGGC AGGAC T GGT T AGGAGAGGG C AGG 1085 

I I I I I I I I I I I I I I I I | | I I I II I II III I I I I I I I I I I I I I I I I I 
Db 6918 AGGGGAC TC TGGAGT CAGAGGTTGGTGT GATC AGGGAAGGGC TGGT TAGGAGA- GGC AT G 6976 

Qy 108 6 GCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCCCCAAG 114 5 

I I I I I II I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6977 GC C C AGGC C C T GC C AGGAATC AAAGT C AGAAACC - TGAGAGGGAAC T GAGGT CC CC CAAG 703 5 

Qy 1146 ACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACCCCCAT 1205 

I I II II I I I I I I I I I I I I 
Db 7036 ATCCTAGTCTAACCCCCACTCCCACAA 7062 

Qy 1206 CTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACCACCCT 12 65 

I I I I III I I I I I I I II I I I I I 

Db 7063 ATCCGCTGCCATTTCGCTGCTCCATTTCCCATTCCTTGCCCT 7104 

Qy 12 66 CCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAACCCCAC 132 5 

III II II II 

Db 7105 CCACCCTCACCA 7116 

Qy 1326 CCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCCGGTTT 1385 

I I I I I I I I I I III 

Db 7117 GGCAGAATCCAGTTC 7131 
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Qy 1386 GCC-CCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACTTGAA 1444 

II I II I I I I I I I I I I I I I I I II I I I I I I I 

Db 7132 CCCTTCTGCTATCAATCCAGGGAAACCCCAGGCTTGGTGCTGGGATGTTTTT 7183 

Qy 1445 CCTCACAGATCTGAGAGAAGCCAGGTTCATTTAATGGTTCTGAGGGGCGGCTTGAGATCC 1504 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7184 T GGGG GTC AGAGAATC AAGGGC ATAG T C C T GAG GGGC C AGT T GAGATC G 7232 

Qy 1505 AC T GAGG GGAG T GGT T T TAGGC TC TGTGAGGAGGC AAGGT GAGAT GC T GAGGGAGGAC T G 1564 

I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7233 GC T GAGG GGAGC GGGC CC AAGC TC T GTGGC GAGGC AAGGT GAGAC T C T GAGGAAGGAC T G 7292 

Qy 1565 AGGAGGC AC AC AC C C C AGG T AGAT GGC C CC AAAATG ATC C AGTAC C AC C C C T GC TGC C AG 1624 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 72 93 AGGAGGC C C C C AC C C AAGAT AGA- GGAACC CAAAT AATC C AGC GC AGC T C C TGC TGC C AG 7 351 

Qy 1625 C C C T GGAC C AC C C GG C C AGGAC AGATGT CTC AGC TGGAC C AC CCCCCGTCCC GT C C C AC T 1684 

I I I I I I I I I I I I I I II III I I I I I III II I I I I I I I I 

Db 7352 TC C T GGAC C AC C C GG GGGAAGACT TCTC A GGCTAGGCCATCCCAGCTCCCACT 7404 

Qy 1685 GCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTTGGTC 1744 

I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 7405 GC C AC T AAAGC TAC AGGGGAC TC T AGAGTCAAGAGC T TGG T GT GC C C A 7452 

Qy 1745 AGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGGACCC 1804 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 7453 AGGCAGGGCCCAGGC TC TGC C T GG CATC GGGG TC AGGAC CT 7493 

Qy 1805 T GG GAGGGAAC T GAGGGT T CC C C AC CC AC AC CTGTCTCCT CAT CTC C AC C GC C AC C C C AC 1864 

I I I I I I I I I I I I I I I I I I I I I I I I I I I IE I II 

Db 74 94 T GAGAGGGAAC T GAGGGC GC TAC AC CC C C AC C C CAT C C GC AT T C CAACAT 7543 

Qy 1865 TCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTGTCAA 1924 

III I I I I I I I I I I I II II III I I I I I I I I I I I 

Db 7544 GCCCAGCCCCATCCCCAACTCCGTTTTGCAGAATCCATTTTT TCCCCTGCAGTCAA 7599 

Qy 1925 CCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCAGGGT 1984 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 600 CCCCGGGAAGACCTGGGAATGGT CAGGC AC TCGGAT C TTGACATC C AC ATCGAGGGC 765 6 

Qy 1985 CTGATGGAGGGAAGGGG C T TGAAC AGGGC C TC AGGGGAGC AGAGGGAG 2032 

II II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7657 TGAAGGAGGGAGAGGGTT T GGTATCATGAGCAGAGC C TCAGGGT AGC AGAGGGAGGACCC 7716 

Qy 2033 - GGC C C TAC T GC GAGAT GAGGGAGGC C TC AGAGGAC C C AGC AC C C TAGGAC 2082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 7717 T GGCC C T C C T GGGAGATGAGGAAGGCC T C AGGAGAC C C AGC AC C CC AAGGC AGGGAGC C C 777 6 

Qy 2083 AC C GC AC CCCTGTCT GAGAC T GAG - - GC TGC C AC T TC TGGC C T C AAGAATC AGAAC GAT G 2140 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 
Db 7777 AC C C C AC CCCTGTCT GAGAATGAGGTGC CTCCTCTTT T AGC C T C AGGAAT C C AAGGGAT G 7836 

Qy 2141 GGGACTCAGAT TGC AT — GGGGGTGGGACCCAGGCC TGC AAGGC TTACGCGGAGGAAGAG 2198 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 7837 GC AAC TC AGGT C AGC AGAGGGGTG GGT T CC AAGC CC T TC C AGGAT C AAGGAAAGGAAGAC 7896 

Qy 2199 GAGGGAGGAC T C AGG GGAC CT TGG AAT C C AGAT C AG TGT G GAC CTC GGC C C T GAGAGGTC 2258 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 7897 GAGGGAGGATTCAGGGGGCCTTGCATTCCAGATCAGTGGAGACCTGGGCCCTGGGAGGTC 7956 

Qy 2259 CAGGGCACGGTGGCCACATATGGCCCATATTTCCTGCATCTTTGAGGT GACAGGAC 2314 
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I I I I I I III I I I I I I I II MM I I II I II I I I II II I II II I II I 

Db 7957 CTGGGCAAGGTAGCCACCTGTAGCTCATACTTCCTGCATCTTCGAGGTCACAGAGAGGAG 8016 

Qy 2315 AGAGC T G TGGT C TGAGAAG TGGGGC C T C AGGT C AAC AGAGGGAGGAGT TC C AGGAT C CAT 2374 

II III I I I II I I I I I II I I I II I I I I I I I II II I I I I II I I I I I I I I I 

Db 8017 AGGGCTATGGTCTGAGGGGTGGTACTTCAGGTCCGCAGAGGGAGGAGTCCCAGGATCTAC 8076 

Qy 2375 ATGGCCCAAGATGTGCC-CCCTTCATGAGGACTGGGGATATCCCCGGCTCAGAAAGAAGG 2433 

I I I I I I II I II I I I I I I II I Mill I I I I I I I I I I II M I I I I I I I II 
Db 8077 AGGAC C C AAGG T GTGC C AC AC T T C AC GAGGAAT GGGGAT ACC TGTGGC T C AGAAAGAC GG 8136 

Qy 2434 GAC T C C AC AC AGTC T GGC TGTCCCCTTT TAGT AGC T C TAGGGGGAC C AGATC AGGG ATGG 2493 

III I I I I I I I I I I I II I II I I I I I II I I I I I I I I II I I II I I I I I I I 1 II I 

Db 8137 GAC C C C AC AGAGT C T GGC TGTCCCCTGTTCT T AGC T C AGGGGGGAC C AGAGGAGGG AT GG 8196 

Qy 2494 CGGTATGTTCCATTCTCACTTGTACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATG 2553 

I I I I I I III I I I I II I II I I II I I I I I I I I I I II I II I II I I I I I I I I I I I 
Db 8197 CC C TAT G TGCC AAT T TC AC T T GT T C CAC AGGC AGGAAGT T GGGGAACC T T C AGGGAGAT G 8256 

Qy 2554 GGGTCTTGGGGTAAAGGGGGGATGTCTACTCATGTCAGGGAATTGGGGGTTGAGGAAGCA 2 613 

III I I I I I I I I I II II I I I I I I II I I I I I I II I I I II II I I I I I I I II 
Db 8257 AGGTTTTGGAGTAAAGGGGCAATGTTTGCTCATCTCAGGGGGTTGGGGGTTGAGGAAGGG 8316 

Qy 2614 CAGGCGC TGGC AGGAATAAAGATGAGTGAGAC AGAC AAGGC TAT TGGAATCC AC AC CCCA 2673 

I II I I III Mill III I II I II I II I I II I II III II II II I II 

Db 8317 CAGGCCCTGTCAGGAGCAAACATGAGT-ACCCACAGGAGGCCATCAGAACCCTCACCCCA 8375 

Qy 2674 GAAC C AAAGGGGT C AGC C C T GGAC AC C T CAC C C AG GATGTGGCTTCTTTTTC 2725 

II I I I I II I II II I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 8376 GAACCAAAGGGGTCAGCCCTGGGCACCCCACACAGGGGTGACAGGATGTGGCTCCTTCTC 8435 

Qy 2726 ACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCTCATTCTCAGAGGGTGACTCAGGTCA 2785 

I I III I I II I II I II I I I I II I I I I I I I I I I II I I I I I I I I I I I I I II I I I 

Db 84 36 ATTTCTGATTCCAGATCTCAGTGAGGTGAGGACCTTGTTCTCAGAGGGTGACTCAGGTCA 84 95 

Qy 2786 ACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCGGTCCCAGGATCTGCCATGCGTTCGG 2845 

I I I II I I I I I I I I I M II I I I I I I II II II I I I I I II I I I I I I I I I II I I 
Db 8496 C C AC AGGGACC C C CATC TG GT C T AC AGAC AC AGTGG T CC C AGGAT C T G CC AAGAG T C C T G 8555 

Qy 2846 GTGAGGAACATGAGGGAGGACTGAGGGTACCCCAGGACCAGAACAC TGAGGGAGAC TGCA 2905 

II I I I I I I I I I I I I II I I I I I II II I I I I I I I I II I I I I I II I III II 

Db 8556 GT GAGGAAT GT GAGG GAGGAT T GAGGGT AC C AC AGGGCC AGAAC GC AGAT GATGAC C C C A 8615 

Qy 2906 CAGAAATCAGCCCTGCCCCTGCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAG 2965 

I II I I II I II II II I I I I I I I I II I I I I I I I I I I M II II I I I II I I I I II III 

Db 8 616 CAGAAATCAGCCCTGCTCCTGTTGTCACCCCAGAGAGCATGGGCTTGGCTTTCTGCTGAG 8 675 

Qy 2966 G T C C T T C C GT T AT C C T GGGAT CAT T GAT GT C AGGGAC GGG GAGG CCTTGGTCT GAG AAGG 3025 

I II I II I I I I II I I I I I II I II I I I II III II II I I I I I I I II I I II I II 
Db 8676 GTCCCTCTCTTATCCTGGGATCACTGGTGTCACGGAGTGGGAGGCCTTGGTCTGAGGGGG 8735 

Qy 3026 C T GCGC T C AGG T C AG T AGAGGGAG C GT C CC AGGC CC T GC C AGGAGTC AAGGT GAGGAC C A 3085 

I II I I II I I M II I I I I I I I I I II I II I I I I I M M II I I I I I II I I I I I I II I 

Db 8736 C T G CAC C C AGG TC AG T AGAGGGAGGGT C CC AGGC TC T GC C AGGAGT TG AGG T GAGGAC C A 8795 

Qy 3086 AGCGGGCACCTCACCCAGGACACATTAATTCCAATGAATTTTGATATCTCTTGCTGCCCT 314 5 

III III II II I I I II I II I I I I II II I II I I I I I II II I I I I II I I I I 

Db 8796 AGCAGGCTCCGCATCCAGGACACATGGGTTCCAATGAATTTCGACATCTTTTGCTGTCGT 8855 

Qy 3146 TC-CCCAAGGACCTAGGCACGTGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCT 3204 

II I I I I I I I I I II I I I M II I II I I II I M I I I I I I I I I 
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Db 8856 TCTTCGGAAGACCTAGGCACAGGTGGCCAGATGTGGGGTTTCTTAGGTCCT GTTCCC 8912 

Qy 3205 TAT C ATGGATG TGAAC TC T TGAT T T GGAT T TC T C AGAC C AGC AAAAGGGC AGGATC C AGG 32 64 

I lit I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8913 T C T C AGGC AT G TGAGC T C T T GATC T GAG T T T C T C AGGC CAGC AAAAGAG T GGGAT C C AGG 8972 

Qy 3265 CCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCCACTGCATGA 3324 

I I I I I I I III I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I 
Db 8973 CCCTGCCTGGAGAAATGTGAGGGCCCTGAGTGAACACAGTGGGGATCATCCACTCCATGA 9032 

Qy 3325 GAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTGGTAGCACTGAGAAGCCAGGGCTGT 3384 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I I II I I I I I I I 
Db 9033 GAG TGGGGAC C TC AC AGAGT C C AG C C TAC C C T C T TG ATGGC AC T GAGGGAC C GGGGC TGT 9092 

Qy 3385 GCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCAGGAACCAGG 3444 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M III 
Db 9093 GC T TAC AGTC T GC AC C C T AAGGGC C CAT GGAT TCCTCTCC TAGG AGC TC C AGGAAC AAGG 9152 

Qy 3445 CAGTGAGGCCT TGGTC TGAGACAGTATCC TCAGGTC ACAGAGCAGAGGATGCACAGGGTG 3504 

I I I I I I I I I E I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 1 I I I I I I I II I I II 

Db 9153 CAG TGAGGCC T TGGTC TGAGACAGTGTC C TCAGGT TACAGAGCAGAGGATGC ACAGGC TG 9212 

Qy 3505 TGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAGGACACA 3564 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 9213 T GC CAGC AG T GAAT GT T T GC C C TGAAT GC AC AC C AAGGGC C C C AC C TGC C AC AAGAC AC A 9272 

Qy 3565 TAGGAC T C C AC AGAGT C T GGC C TC AC C T CC C TAC T G TC AG TC C T GT AGAAT C GAC C TC TG 3624 

I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I III I I I I I I I I I I I I I I I I I I I 

Db 9273 TAGGAC T C C AAAGAGT C T GGC C TC AC C T C C C TAC C ATC AATC C T GC AGAAT C GACC TC TG 9332 

Qy 3625 CTGGCCGGCTGTACCCTGA-GTACCCTCTCACTTCCTCCTTCAGGTTTTCAGGGGACAGG 3 683 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I 

Db 9333 CTGGCCGGCTATACCCTGAGGTGCTCTCTCACTTCCTCCTTCAGGTTCTGAGCAGACAGG 9392 

Qy 3684 C C AAC C C AGAGGAC AGGAT TC C C T GGAGGC C AC AGAGGAGC AC C AAGG AGAAGAT C TG T A 3743 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I ! I I I I I I I I M I 
Db 9393 C C AAC C G- GAGGAC AGG AT T C C C TGGAGGC C AC AGAGGAGC AC C AAGGAGAAGAT C TG T A 94 51 

Qy 3744 AGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCACACACTCC 3803 

I I I I ! I I I I I I I I I I I I III III II I I I II I I I I I I I I I I I I I II I I I I I I 
Db 94 52 AGT AAGC C T T T GT TAGAGC C TC T AAGAT T T GG T T C T CAGC TGAGGTC T C T C AC AT GC T CC 9511 

Qy 3804 CTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTG 38 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I 
Db 9512 CTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCCAGCTTTTGCCTGCACTCTTGCCTGCTG 9571 

Qy 38 64 C C C TGAC GAGAGT C ATC AT GT C TC T TGAGC AG AGGAGT C T GC AC TGC AAGC C T GAGGAAG 392 3 

I I I II I I I I I I II I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9572 C C C TGAC C AGAGTC ATC AT GT C T T C TGAGC AGAAGAGTC AGC AC T GC AAGC C T GAG GAAG 9631 

Qy 3924 CCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I II I I I I I I I I I I II I I I I I I I II I I I I II III I I I I I I I II 
Db 9632 GC GT TGAGGCC CAAGAAGAGGCCCTGGGCCTGGTGGGTGCACAGGCTCC TAC TAC TGAGG 9691 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGC 4019 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 9692 AGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTCTGGTCCCTGGCACCCTGGAGGAAGTGC 97 51 

Qy 4020 CCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTA 407 9 

I I I I I I I I I I I III I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9752 CTGCTGCTGAGTCAGCAGGTCCTCCCCAGAGTCCTCAGGGAGCCTCTGCCTTACCCACTA 9811 
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Qy 4080 C CAT C AAC T T C AC TC GAC AGAGGC AAC C C AGT GAGGGTTC C AGC AGCC GTGAAGAGGAGG 4139 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 9812 CCATC AGC TTCACTTGCTGGAGGCAACCCAATGAGGGTTCCAGC AGCC AAGAAGAGGAGG 9871 

Qy 4140 GGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGG 4199 

I I II I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I M 
Db 9872 GGCCAAGCACCTCGCCTGACGCAGAGTCCTTGTTCCGAGAAGCACTCAGTAACAAGGTGG 9931 

Qy 4200 CTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAG 4259 

III I I I I I I I I I I I I I I I I III I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9932 ATGAGTTGGCTCATTTTCTGCTCCGCAAGTATCGAGCCAAGGAGCTGGTCACAAAGGCAG 9991 

Qy 4260 AAAT GC TGGAG AGT G TC AT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAG 4319 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 
Db 9992 AAAT GC TGGAG AGAG TC AT C AAAAAT T AC AAGC GC T GC T T TC C T GT GAT C T T C GGC AAAG 10051 

Qy 4320 C C T C T GAGTC C T T GC AGC TGGT C T T TGGC AT T GAC G T GAAGGAAGC AGAC C C C AC C GGC C 437 9 

I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 10052 C C T C C GAGTC C C T GAAGATGAT C T T TGGC AT T GAC G T GAAGGAAGT GG AC C C CGC C AGC A 10111 

Qy 4380 ACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATC 4439 

II I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10112 ACACCTACACCCTTGTCACCTGCCTGGGCCTTTCCTATGATGGCCTGCTGGGTAATAATC 10171 

Qy 4440 AGAT C ATGC C C AAGAC AGGC T T C C TGAT AAT T GT C C T GGT C AT GAT T GCAAT GGAGGGC G 4499 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 10172 AGATCTTTCCC AAGAC AGGCCTTC TGAT AATCGTCCTGGGC AC AAT TGC AAT GGAGGGCG 10231 

Qy 4 500 GC C AT GC T C C T GAGG AGGAAAT C T GGGAGGAG C TGAGTGT GAT GGAGG TG T AT GAT GGGA 4559 

I II I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10232 ACAGCGCCTCTGAGGAGGAAATCTGGGAGGAGCTGGGTGTGATGGGGGTGTATGATGGGA 10291 

Qy 4560 GGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAA 4619 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10292 GGGAGCACAC T GTC TATGGGGAGC CCAGGAAAC TGC TC AC CCAAGAT T GGGT GC AGGAAA 10351 

Qy 4 620 AGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGG 4678 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 10352 AC T AC C TGGAG TAC C GGC AGGTAC C CGGCAGT AAT C C TGC GC GC TATGAGT T C C T G TGGG 10411 

Qy 4 679 GTC C AAGGGC C C T C GC T GAAAC C AGC T AT GT GAAAG T CC T T GAG TAT G T GAT C AAGGT C A 4738 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I III I I I I I 
Db 10412 GTCCAAGGGCTCTGGCTGAAACCAGCTATGTGAAAGTCCTGGAGCATGTGGTCAGGGTCA 10471 

Qy 4739 GT GC AAGAGT TCGCTTTTTCTTCC CAT C C C T GC GTGAAGC AGC T TT GAGAGAGGAG GAAG 4798 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10472 AT GC AAGAG T T C GC AT TGC C TAC C CAT C C C T GC GTGAAGC AGC T TT GT TAGAGGAG GAAG 10531 

Qy 4799 AGGGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGG GGAC T GGGC C AGT G 4854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I II II I I I I I I I I I I I 

Db 10532 AGGGAGTCTGAGCATGAGTTGCAGCCAGGGCTGTGGGGAAGGGGCAGGGCTGGGCCAGTG 10591 

Qy 4855 CACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTT 4914 

II II II III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10592 CATCTAACA--GCCCTGTGCAGCAGCTTCCCTTGCCTCGTGTAACATGAGGCCCATTCTT 1064 9 

Qy 4915 CACTC TGAAGAGAGCGGT C AGTGT TC TC AGT AGT AGGT T TC TGT TC T AT TGGGTGA 4970 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I III 

Db 10650 CACTCTGTTTGAAGAAAATAGTCAGTGTTCTTAGTAGTGGGTTTCTATTTTGTTGGATGA 10709 
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I 1 


Qy 4971 CTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGG 5030 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I II I I I II I I I I I I I 
Db 10710 CTTGGAGATTTATCTCTGTTTCCTTTTACAATTGTTGAAATG-TTCCTTTTAATGGATGG 107 68 

Qy 5031 TTGAATGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATAT 5090 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I El I I I I I I M I I I I 

Db 10769 T TGAAT T AAC T TC AGC AT C C AAGT T TAT GAAT C GT AGT T AAC G TAT AT TGC T GT T AATAT 10828 

Qy 5091 AGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAA 5150 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 10829 AGT T T AGGAGT AAGAGT C TTGTTTTT TAT T C AGAT T GGGAAAT C CGT T C TAT T T T G TGAA 10888 

Qy 5151 TTGGG ATAAT AAC AGC AG T GGAAT AAGT AC TT AGAAAT GTGAAAAAT GAGC AGTAAA 5207 

I I I I I I I II I I I I I I I I I I II I II M I I I I I I I I I I I III I I I I I 

Db 10889 T T T GGGAC ATAAT AAC AGC AGT GG AGT AAGT AT TTAGAAGT GT G AATTCACCGTGAA 10945 

Qy 5208 AT AGAT GAGAT AAAGAAC T AAAGAAAT T AAGAGAT AGTC AAT T C T T GC C T TAT AC C T C AG 5267 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10946 ATAGGTGAGAT AAAT T AAAAGATAC T T AAT T C C C GC C T TAT GC C T C AG 10993 

Qy 52 68 TCTATTCTGTAAAATTTTTAAAGATATATGCATACCTGGATTTCCTTGGCTTCTTTGAGA 5327 

I I I I I I I I I I I I I I I I I III I II I I I I I I I I I I I II I I I I I I I I I I I I I I I II 
Db 10994 TCTATTCTGTAAAATTTAAAAATATATATGCATACCTGGATTTCCTTGGCTTC GTGA 11050 

Qy 5328 ATGTAAG AGAAAT TAAATC TGAAT AAAG AAT TCTTCCTGTTC AC TGGCTCTTTTCTTCTC 5387 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 11051 AT G TAAG AGAAAT TAAATC T GAAT AAAT AAT T C T T T C T GT TAAC TGGC TC AT TTCTTCTC 11110 

Qy 5388 CAT GC AC TGAGC ATC T GC T T T T T G GAAGGC C C T GGG T TAGT AGT GGAGAT GC T AAGGTAA 5447 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III I I I I I 
Db 11111 TATGCAC TGAGCATC TGC TC TGTGGAAGGC CCAGGATTAGTAGT GGAGAT AC TAGGGTAA 11170 

Qy 5448 GC C AGAC T CAT AC CC AC C C AT AGGGT C G TAGAGT C T AGGAGC TG C AGT C AC G TAAT C GAG 5507 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 

Db 11171 GCC AGAC AC AC AC CT AC C GAT AGGGT AT TAAGAGTC TAGGAGCGCGGTCATATAAT TAAG 11230 

Qy 5508 GTGGCAAGATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCT 5567 

III I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I 

Db 11231 GTGACAAGATGTCCTCTAAGATGTAGGGGAAAAGT AACGAGTGTGGGTATGGGGCT 11286 

Qy 5568 CCGGGTGAGAGTGGTGGAGTGTCAATGCCC TGAGC TGGGGC AT TTTGGGCTTTGGGAAAC 5627 

II I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 11287 CCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGTG-TGGGGCCTTTTGGGCTTTGGGAAAC 11345 

Qy 5628 TGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I II II II I I II II I I I I I I I I I I I I I I I I I I I I III 
Db 11346 TGCATTTTCTTCTGAGGGATCTGATTCTAATGAAGCTTGGTGGGTCC 11392 

Search completed: August 25, 2006, 10:43:22 
Job time : 951 sees 
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SCORE Search Results Details for Application 
08819669 and Search Result us-08-819-669e 
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Score Home Retrieve Application SCORE System SCORE Comments / 

Page List Overview FAQ Suggestions 

This page gives you Search Results detail for the Application 08819669 and Search Result us-08- 

819-669e-8.rst. 

start 

Go Back to previous page 

GenCore version 5.1.9 
Copyright (c) 1993 - 2006 Biocceleration Ltd. 


OM nucleic - nucleic search, using sw model 

Run on: August 25, 2006, 10:02:12 ; Search time 24214 Seconds 

(without alignments) 
13103.423 Million cell updates/sec 

US-08-819-669E-8 
Perfect score: 5674 

1 CCCGGGGCACCACTGGCATC TAATGATC T T GGGTGGAT CC 5674 


Title: 
Perf ec 
Sequence : 

Scoring table: 


I DENT I T Y_NUC 

Gapop 10.0 , Gapext 1.0 


Searched: 48236798 seqs, 27959665780 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 


96473596 


Database 


EST: * 


1 


gb_estl : * 

2 


gb_est3 : * 

3 


gb est4:* 

4 


gb est5:* 

5 


gb est6:* 

6 


gb htc:* 

7 


gb_est2 : * 

8 


gb est7:* 

9 


gb_est8:* 

10: 

gb_est9: * 

11: 

gb_gssl: * 

12: 

gb_gss2 : * 

13: 

gb_gss3: * 

14: 

gb_gss4 : * 


Pred. No. is the number of results predicted by chance to have a 
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score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 


SUMMARIES 

% 

Result Query 

No. Score Match Length DB ID Description 


1 

1062 

18 . 

7 

1652 

6 

CR594285 

CR594285 full-leng 

2 

1036. 4 

18. 

3 

2151 

6 

HSM806642 

BX640600 Homo sapi 

3 

1034. 4 

18. 

2 

1671 

6 

CR622709 

CR622709 full-leng 

4 

1032 

18. 

.2 

1689 

6 

CR595748 

CR59574 8 full-leng 

5 

1022.4 

18. 

.0 

1738 

6 

CR623041 

CR623041 full-leng 

6 

1008. 6 

17. 

.8 

1661 

6 

CR611124 

CR611124 full-leng 

7 

918 

16. 

.2 

930 

14 

DQ034885 

DQ034885 Homo sapi 

8 

840.2 

14. 

.8 

1020 

2 

BM459064 

BM4 59064 AGENCOURT 

9 

787.2 

13. 

.9 

923 

14 

DQ03488 6 

DQ034886 Pan trogl 

10 

783. 6 

13. 

.8 

1739 

6 

CR619399 

CR619399 full-leng 

11 

740.2 

13. 

.0 

909 

3 

BU157186 

BUI 57 18 6 AGENCOURT 

12 

720.2 

12. 

.7 

747 

4 

CA428506 

CA428506 UI-H-FEl- 

13 

700 

12. 

.3 

954 

14 

DQ049942 

DQ049942 Homo sapi 

14 

678.4 

12. 

.0 

1008 

14 

DQ034795 

DQ0347 95 Homo sapi 

15 

675.8 

11. 

.9 

811 

3 

BQ224380 

BQ22438 0 AGENCOURT 

16 

652 

11. 

.5 

937 

3 

BU153093 

BUI 530 9 3 AGENCOURT 

17 

645 

11. 

A 

668 

4 

CA423766 

CA423766 UI-H-FE1- 

18 

621.4 

11. 

.0 

623 

8 

CV023387 

CV023387 311 Full 

19 

615.8 

10. 

.9 

1044 

1 

AL562721 

AL562721 AL562721 

20 

615 

10. 

.8 

637 

3 

BM989182 

BM989182 UI-H-DP0- 

21 

60 9 

10. 

.7 

1191 

3 

BM907822 

BM907822 AGENCOURT 

22 

607. 6 

10. 

.7 

1041 

4 

BX361005 

BX361005 BX361005 

23 

602. 6 

10. 

.6 

957 

14 

DQ035556 

DQ035556 Pan trogl 

24 

601 

10. 

.6 

957 

14 

DQ035555 

DQ035555 Homo sapi 

25 

583.8 

10. 

.3 

918 

14 

DQ049943 

DQ049943 Pan trogl 

26 

583 

10. 

.3 

964 

4 

BX361006 

BX361006 BX361006 

27 

566.6 

10, 

.0 

922 

3 

BU175213 

BUI 7 52 13 AGENCOURT 

28 

562. 4 

9. 

.9 

947 

4 

BX384326 

BX384326 BX384326 

29 

558.8 

9, 

.8 

1006 

14 

DQ034796 

DQ034796 Pan trogl 

30 

537.4 

9, 

.5 

876 

2 

BF792356 

BF792356 602252896 

31 

536.8 

9. 

.5 

1021 

2 

BM470991 

BM4 70991 AGENCOURT 

32 

532.2 

9, 

.4 

960 

14 

DQ031722 

DQ031722 Pan trogl 

33 

531 

9. 

.4 

878 

2 

BG397171 

BG397171 602434130 

34 

528. 8 

9, 

.3 

960 

14 

DQ031721 

DQ031721 Homo sapi 

35 

526. 6 

9, 

.3 

1050 

2 

BG024106 

BG024106 602303163 

36 

525.2 

9 

.3 

1016 

3 

BM556490 

BM556490 AGENCOURT 

37 

524. 6 

9 

.2 

1057 

3 

BM562570 

BM56257 0 AGENCOURT 

38 

524. 4 

9 

.2 

1049 

4 

CA488474 

CA4 8847 4 AGENCOURT 

39 

523 

9 

.2 

1002 

3 

BM562 4 65 

BM562465 AGENCOURT 

40 

522.6 

9 

.2 

802 

14 

DQ034776 

DQ034776 Homo sapi 

41 

522. 6 

9 

.2 

962 

2 

BG116297 

BG116297 602318570 

42 

522. 4 

9 

.2 

1011 

4 

BX341218 

BX341218 BX341218 

43 

520. 8 

9 

.2 

872 

2 

BM449726 

BM4 4 972 6 AGENCOURT 

44 

519. 4 

9 

.2 

806 

2 

BG030623 

BG030623 602299402 

45 

516. 4 

9 

.1 

1066 

2 

BM549169 

BM54 9169 AGENCOURT 


ALIGNMENTS 


RESULT 1 
CR594285 

LOCUS CR594285 1652 bp mRNA linear HTC 21-JUL-2004 
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DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
REMARK 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 


COMMENT 


FEATURES 

source 


full-length cDNA clone CS0DJ013YK23 of T cells (Jurkat cell line) 
Cot 10-normalized of Homo sapiens (human) . 
CR594285 

CR594285. 1 GI: 504 750 92 
HTC; CNSLT_cDNA. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae ; Homo . 

1 (bases 1 to 1652) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 

2 (bases 1 to 1652) 
Genoscope . 
Direct Submission 

Submitted (20- JUL-2004 ) Genoscope - Centre 
BP 191 91006 EVRY cedex - FRANCE (E-mail 
- Web : www.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 

Location/Qualifiers 

1. .1652 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref ="taxon: 9606" 
/clone="CS0DJ013YK23" 

/tissue_type="T cells (Jurkat cell line) Cot 

10-normalized" 

/pla smid= "pCMVS P0RT_6 " 


National de Sequencage : 
seqref @genoscope. ens . f r 


ORIGIN 


Query Match 18.7%; 
Best Local Similarity 84.0%; 
Matches 1304; Conservative 


Score 1062; DB 6; Length 1652; 
Pred. No. 6.6e-254; 
0; Mismatches 215; Indels 33; 


Gaps 


8; 


Qy 

3835 

Db 

102 

Qy 

3895 

Db 

162 

Qy 

3955 

Db 

222 

Qy 

3994 

Db 

282 

Qy 

4054 


CCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCA 3894 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I MINIM 
CTAGCTCCTGCCCACACTCCTACCTGCTGCCCTGACCAGAGTCATCATGCCACTTGAGCA 161 

GAG GAG T C T GC AC T GC AAGC C TGAGGAAGC C C T T GAGGC C C AAC AAGAGGC C C T GGGC C T 3954 
I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
GAGGAGT C AGC AC T GC AAG C C T GAGGAAGGC C T TGAGGC C C AAGGAGAGGCC C T GG GC TT 221 

GGTGTGTGTGCAGGCT GCCACCTCCTCCTCCTCTCCTCT 3993 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGTGGGTGCGCAGGCTCCTGCTACTGAGGAGCAGGAGACTGCCTCCTCCTCCTCTACTCT 281 

GGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCC 4053 

II I I I I I I I I I I I I I I I I I I I I I I I I M I I I M II II M I M M 
AGTGGAAGTCACCCTGCGGGAGGTGCCTGCTGCCGAGTCACCAAGTCCTCCCCACAGTCC 341 

TC AGGGAGC CTCCGCCTTTCC C AC T AC CATC AAC T T C AC T C GAC AGAG GC AAC C C AGTGA 4113 
I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I I I I I I I I I I I I I M 
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Db 342 T C AGGGAGC C T C C AC CC T C C C C AC TAC C ATC AAC TAT AC T C TC T GGAG TC AAT C C GATGA 401 

Qy 4114 GGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTT 4173 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 402 GGGC T C C AGC AAC GAAGAAC AGGAAGGGCC AAGC AC C T T T C C TG AC C T GGAG AC GAGC T T 4 61 

Qy 4174 CCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCG 4233 

II || || | Ml II M I I I I I I I I I I I I I II I I I I I I I I I I I! I I I I I I I 1 

Db 462 C C AAG TAGC AC TC AG TAGGAAGAT GGC T GAGT T GGT TC AT T T T C TGC T C C TC AAG T ATC G 521 

Qy 4234 AGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGTCATCAAAAATTACAAGCA 4293 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 522 AGCCAGGGAGCCATTCACAAAGGCAGAAATGCTGGGGAGTGTCATCAGAAATTTCCAGGA 581 

Qy 4294 CTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGA 4353 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 

Db 582 CTTCTTTCCTGTGATCTTCAGCAAAGCCTCCGAGTACTTGCAGCTGGTCTTTGGCATCGA 641 

Qy 4 354 CGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTC 4 413 

Ml I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I 
Db 642 GGTGGTGGAAGTGGTCCGCATCGGCCACTTGTACATCCTTGTCACCTGCCTGGGCCTCTC 701 

Qy 4414 C TAT GAT GGC C T GC T GGGT GAT AAT CAGATC AT GC C C AAG AC AGGC T T C C T GAT AAT T GT 4473 

III I I I I I I I I I I I I M II I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I II 

Db 702 C TAC GAT GGC C T GC T GGGC GAC AAT CAGATC GT GC C C AAG AC AGGC C T C C TGATAAT C GT 761 

Qy 4474 CCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCT 4533 

I I I I I Ml M I I I I I I I I I I I f Ml II II I I I I I I II I I I I I I I I I I II I 

Db 762 C C T GGC CAT AAT C GC AAAAGAGGGC GAC T GT GC C C C TGAGGAGAAAAT C T GGGAGGAGC T 821 

Qy 4534 GAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCT 4593 

II II II I I I M I I I I I I I II I I I I I I I I I I I II II II E I I II I I I I I I I I 

Db 822 GAG T GTG T T GGAGGC AT C T GAT GGGAGGGAGGAC AG T G T C T T T GC GC AT C C C AGGAAGC T 881 

Qy 4 594 GCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGA 4 652 

I I I II I I E I I I I I II I I I I I I I I II I I I I II I I II I I I I I I I I I II II I IE I II I 
Db 882 GC T C AC C C AAG AT T T GGTG C AGGAAAAC TAC C T GGAGT AC C GGC AGGT C C C C GGC AGT GA 941 

Qy 4653 TCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAA 4712 

Ml I I I I II T I I II I I II I I I I II I I I I I I IE I IE I I I II I I I I E I i I I I I I I I It 
Db 942 TCCTGCATGCTACGAGTTCCTGTGGGGTCCAAGGGCCCTCGTTGAAACCAGCTATGTGAA 1001 

Qy 4713 AGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCG 4772 

I I I I II I I I I I I I I I I I I II I' I I I I I I I I I I I II II I I I I I I 
Db 1002 AGT C C T G C AC C AT T T GC TAAAGAT CAGT GGAGGAC C T C AC AT T T C C TAC C C AC C C C TGCA 1061 

Qy 4773 TGAAGC AGC T T T GAGAGAGGAGGAAGAGGGAGTC TG AGC AT GAG T TGC AGC C AAGGC C AG 4832 

I I I I EMM I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 

Db 1062 TGAAT GGGC T T T T AGAGAG GGGGAAGAG TGAGT C T GAGC AC GAG T T GC AGC C AGGGC C AG 1121 

Qy 4833 TGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTC 4892 

II I II I II I I I II I I I II I I I I I I I II I I I I I I I I I I I I II Mil I I I I II I 

Db 1122 TGGGAGGGGGTCTGGGCCAGTGCACCTTCCAAGGCCCCATCCATTAGTTTCCACTGCCTC 1181 

Qy 4893 GTGTGACATGAGGCCCATTCTTCACTC — TGAAGAGAGCGGTCAGTGTTC TCAGTAGTAG 4 950 

II I M I II II II II II I I II I El I II I I II I II El I I I I I I I II I I I I I I I 
Db 1182 GTGTGATATGAGGCCCATTCTTCACTCTTTGAAGAGAGCAGTCAGTATTGTTAGTAGTGA 1241 

Qy 4 951 GTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAA 5010 

I II I II I I I II I II I I I I II I I I I I I I I I I I I I I I II I II II I I II II I I I I I M 

Db 1242 GTTTCTGTTCTATTGGATGACTTTGAGATTTATCTTTGTTTCCTGTTGGAATTGTTCAAA 1301 
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Qy 5011 TGTTTTTTTT T AAGGGATGGT TGAATGAAC T T C AGC ATC C AAGT T TAT GAAT GAC AGC AG 5070 

I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I II I I I I I 
Db 1302 TGTTCC-TTT T AAC GGATGG T TGAAT GAAC T T C AGC ATC C AAGT T TAT GAAT GAC AGT AG 1360 

Qy 5071 TCACAC — AGT TC T GT G TAT AT AGT T T AAGGGT AAGAGT C TTGTGTTT TAT T C AGAT T GG 5128 

I I I I I I Ml I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1361 T C AC AC AT AGT GC TG T T T AT ATAGT TT AGGAG TAAGAGTGT T GT T T T T TAT T C AGATTGG 1420 

Qy 512 9 GAAAT C C AT TC TAT T T T GT GAAT TGGGA- T AAT AAC AG C AGT GGAAT AAG TA CTTA 5183 

I I I I I I I I I I I I I I I 1 I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1421 GAAATCCATTCCATTTTGTGAATTGTGACAAATAACAGCAGTGGAAAAAGTATGTGCTTA 1480 

Qy 5184 GAAATGTGAAA-AATGAGCAGTAAAATAGATGAGATAAAGAACTAAAGAAATTAAGAGAT 5242 

Ml I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1481 GAATTGTGAAAGAATTAGCAGTAAAATACATGAGATAAAGACCTCAAGAAGTTAAAAGAT 1540 

Qy 5243 AGT C AAT T C T T GC C T TAT AC C T C AGTC T AT T C T GTAAAAT T T T T AAAGAT AT AT GC AT AC 5302 

I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I II Ml I Ml I I I I 
Db 1541 AC T T AAT TC T T GC C T TAT AC C TC AC TC T AT TC TGT AAAT T T GAAAAAAAAGC AT GGAT AC 1600 

Qy 5303 C TGGAT T T C C T TGGC T T C T T TGAGAAT GTAAGAGAAAT T AAAT C T GAAT AAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1601 C T GGAT ATC C T T GGC T TC T T T GAGAAT T TAAGAGAAAT T AAAT C TGAAT AAA 1652 
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HSM806642 2151 bp mRNA linear HTC 20-JAN-2005 

Homo sapiens mRNA; cDNA DKFZp686A13192 (from clone DKFZp68 6A13192 ) . 
BX640600 

BX64 0 600. 1 GI : 34 364 600 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae ; Homo . 
1 (bases 1 to 2151) 

Poustka,A., Albert, R., Moosmayer , P . , Schupp,I., Wellenreuther , R . , 
Mewes,H.W., Weil,B., Amid,C, Osanger,A., Fobo,G., Han,M. and 
Wiemann, S . 

The German cDNA Consortium 
Direct Submission 

Submitted ( 20- JAN-2005 ) MIPS, Ingolstaedter Landstr.l, D-85764 
Neuherberg, GERMANY 

Clone from S. Wiemann, Molecular Genome Analysis, German Cancer 
Research Center ( DKFZ ) ; Email s.wiemann@dkfz-heidelberg.de; 
sequenced by DKFZ (German Cancer Research Center, 

Heidelberg/Germany) within the cDNA sequencing consortium of the 
German Genome Project. This clone (DKFZp68 6A13192 ) is available at 
the RZPD Deutsches Ressourcenzentrum fuer Genomf or schung GmbH in 
Berlin, Germany. Please contact RZPD for ordering: 
http: //www.rzpd.de/cgi-bin/products/cl.cgi?CloneID=DKFZp68 6Al3192 
Further information about the clone and the sequencing project is 
available at http://mips.gsf.de/projects/cdna/. 

Location/Qualifiers 

1. .2151 

/organism="Homo sapiens" 
/mol_type="mRNA" 

/db xref="RZPD:DKFZp686A13192Q" 
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/db_xref ="taxon: 9606" 
/clone="DKFZp686A13192" 
/tissue_type="esophagus tumor" 

/clone_lib="686 (synonym: hlcc3). Vector pSportl_Sfi; host 
DH10B; sites SfilA + SfilB" 
/de v_s ta ge= " adult " 

/note="melanoma antigen, family A, 6" 
gene 1 . . 2151 

/gene="DKFZp686A13192" 
CDS 569. .1513 

/gene="DKFZp68 6A13192" 

/codon_start=l 

/product="hypothetical protein" 
/protein_id="CAE45706 . 1" 
/db_xref="GI: 34364601" 
/db_xref="InterPro:IPR002190" 

/ trans la tion="MPLEQRSQHCKPEEGLEARGEALGLVGAQAPATEEQEAASSSST 
LVEVTLGEVPAAESPDPPQSPQGASSLPTTMNYPLWSQSYEDSSNQEEEGPSTFPDLE 
SEFQAALSRKVAKLVHFLLLKYRAREPVTKAEMLGSWGNWQYFFPVIFSKASDSLQL 
VFGIELMEVDPIGHVYIFATCLGLSYDGLLGDNQIMPKTGFLIIILAIIAKEGDCAPE 
EKIWEELSVLEVFEGREDSIFGDPKKLLTQYFVQENYLEYRQVPGSDPACYEFLWGPR 
ALIETSYVKVLHHMVKISGGPRISYPLLHEWALREGEE" 

ORIGIN 

Query Match 18.3%; Score 1036.4; DB 6; Length 2151; 

Best Local Similarity 82.1%; Pred. No. 1.8e-247; 

Matches 1300; Conservative 0; Mismatches 2 51; Indels 33; Gaps 8; 

3816 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 3875 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
504 GCCAGTGGGTCTCCATTGCCCAGCTCCTGCCCACACTCCCGCCTGTTGCCCTGACCAGAG 563 

3876 T CATC AT GT C T C T T GAGC AGAGGAGTC T GC AC T GC AAGC C T GAGGAAG C C C T TGAGGC C C 3935 

I I I I I I 1 I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

564 T CAT CAT GC C T C T T G AGC AGAGGAG T C AGC AC T GC AAGC C T GAAGAAGGC C T T GAGGC C C 623 

3936 AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCT GCCA 3974 

I I I I I I I I I M I I I I I I E M I I I I I I I II I M 
624 GAGGAGAGGCCCTGGGCCTGGTGGGTGCGCAGGCTCCTGCTACTGAGGAGCAGGAGGCTG 683 

3975 CCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAA 4034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II E I I I I I I 

684 CCTCCTCCTCTTCTACTCTAGTTGAAGTCACCCTGGGGGAGGTGCCTGCTGCCGAGTCAC 743 

4035 C AGAT C C TC C C C AGAGTC C T C AGGGAGC C TC C GC C T T T C C C AC T AC CAT C AAC T T C AC TC 4094 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
74 4 C AG AT C C T C C C C AGAG T C C T CAGGGAGC C TC C AGC C TC C C C AC T AC CAT GAAC T AC C C T C 803 

4095 GAC AGAG GC AAC C C AGTGAGGGT T C CAG C AGC C GTGAAGAGGAGGGGC C AAGC AC C T C T T 4154 
Ml Ml II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 
804 TC T GGAGC C AATC C TAT GAGGAC T C C AGC AAC C AAGAAGAGGAGGGGC C AAGC AC C T TC C 863 

4155 GTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTT 4214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
8 64 CTGACCTGGAGTCTGAGTTCCAAGCAGCACTCAGTAGGAAGGTGGCCAAGTTGGTTCATT 923 

4215 T T C T GC T C C TC AAAT AT C GAGC CAGGGAGC C AG TC AC AAAGGC AGAAATGC T GGAG AGT G 4274 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
924 TTCTGCTCCTCAAGTATCGAGCCAGGGAGCCGGTC AC AAAGGC AGAAATGC TGGGGAGTG 983 

4275 TCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGC 4334 


Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
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II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 984 TCGTCGGAAATTGGCAGTACTTCTTTCCTGTGATCTTCAGCAAAGCTTCCGATTCCTTGC 1043 

Qy 4 335 AGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTG 4 394 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1044 AGCTGGTCTTTGGCATCGAGCTGATGGAAGTGGACCCCATCGGCCACGTGTACATCTTTG 1103 

Qy 4395 TCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGA 4454 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1104 CCACCTGCCTGGGCCTCTCCTACGATGGCCTGCTGGGTGACAATCAGATCATGCCCAAGA 1163 

Qy 4455 C AGGC T T C C T GATAAT T GT C C T GG T CAT GAT T GC AAT GGAGGGC GGC C AT GC T C C T GAGG 4514 

I I I I I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I 

Db 1164 CAGGCTTCCTGATAATCATCCTGGCCATAATCGCAAAAGAGGGCGACTGTGCCCCTGAGG 1223 

Qy 4 515 AGG AAAT C T GGGAGGAGC T GAGT G T GAT GGAGGT GT AT GAT GGGAGGGAGCACAGT GC C T 4574 

II I I I I I I I I I I I I I I II I I II I II I I I I I I I I III MINIM I I I I I II 

Db 1224 AGAAAAT C TGGGAGGAGCT GAGTG TGT T AGAGGTGT T TGAGGGGAGGGAAGAC AGT ATCT 1283 

Qy 4575 AT GGGGAGC C C AGGAAGC T GC T C AC CC AAGAT T T GG T GC AGGAAAAGT AC C T GGAG T A- C 4 63 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1284 T C GGGGAT C C C AAGAAGC T GC TC AC CC AAT AT T T CG TGC AGGAAAAC T AC C T GGAG T AC C 134 3 

Qy 4 634 GGC AGGTGCCGGACAGTGATCCCGCACGC TAT GAGT TCCTGTGGGGTCCAAGGGCCCTCG 4 693 

I I I I I I I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1344 GGCAGGTCCCCGGCAGTGATCCTGCATGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCA 1403 

Qy 4694 C T GAAAC C AGC TAT G T GAAAGT C C T T GAGT AT GT GAT CAAGGT C AGTGC AAGAGT T C GC T 4753 

I I I I I I I I I I I I I I I I I I I I I I I I I II II I Ml I I I I I I I II I I I I 

Db 1404 T T GAAAC C AGC TAT G T GAAAG T C C T GC AC CAT AT GG TAAAGAT C AGT GGAGGAC C T C GC A 1463 

V 

Qy 4754 TTTTCTTCC CAT C C C TGC G T GAAGC AGC T TT GAGAGAGGAGGAAGAGG GAGT C T GAGCAT 4813 

Ml II I I I I I I I I I III I I I I II I I I I I I I I I I I I I I I I I I II I I I I I 

Db 14 64 T T T C C T AC C C AC T C C T GC ATGAGT GGGC T T T G AGAG AGGGGGAAGAGT GAGT C T GAGC AC 1523 

Qy 4814 GAGT TGC AGCCAAGGCC AG TGGGAGGGGGACT GGGC C AGTGC AC CTTCCAGGGCCGCGTC 4873 

I I I I I I I I I I I I II I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1524 GAGTTGCAGCCAGGGCCAGTGGGAGGGGGTTTGGGCCAGTGCACCTTCCGGGGCCCCATC 1583 

Qy 4874 CAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTC — TGAAGAGAGCGG 4931 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1584 CCTTAGTTTCCACTGCCTCCTGTGACGTGAGGCCCATTCTTCACTCTTTGAAGCGAGCAG 164 3 

Qy 4932 TCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTC 4991 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1644 TCAGCATTCTTAGTAGTGGGTTTCTGTTCTGTTGGATGACTTTGAGATTATTCTTTGTTT 1703 

Qy 4 992 TCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCA 5051 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1704 CCTGTTGGAGTTGTTCAAATG-TTCCTTTTAACGGATGGTTGAATGAGCGTCAGCATCCA 17 62 

Qy 5052 AGT T TAT GAAT GAC AGC AG T C AC AC — AGT TC TGT GT AT AT AGT TTAAGGGT AAGAGT C T 5109 

I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1763 GGT T TAT GAAT GAC AGT AG T C AC AC AT AG T GC T GT T TAT AT AGT T TAGGAGT AAGAGT C T 1822 

Qy 5110 TGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGG — ATAATAACAGCA 5167 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I 

Db 1823 TGT T TT T TAT T C AGAT T GGGAAAT C CAT T C CAT T T T GTGAAT T GT GAC AT AAT AAT AGC A 1882 

Qy 5168 GTGGAAT AAGT AC T T - AGAAAT GT G AAAAAT GAGC AG T AAAAT AG ATGAGATAAAGAAC T 5226 

I I I I I I I I I I I I I II I I II M III I I I I I I 
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Db 1883 GTGGAAAAAGT AT T T GC T T AAAAT TGT GAGC GAAT T AGC AAT AAC AT AC AT GAGAT AACT 1942 

Qy 5227 AAAGAAAT TAAGAGAT AGT C AATT C T T GCC T TAT AC C T C AGT C TAT T C T GT AAAAT T T T T 5286 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1943 C AAGAAAT C AAAAGAT AGT TGAT TCTTGCCTT GTAC C T C AAT C TAT T C T GTAAAA TT 1999 

Qy 5287 AAAGATAT AT GC ATAC C TGGAT T T C C T T GGC T T CT T TGAGAAT G TAAGAGAAAT T AAATC 5346 

Ml I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 
Db 2000 AAAC AAAT ATGC AAAC C AGGAT T T C C T T GAC T TC T T TGAGAATGC AAG C GAAAT T AAATC 2059 

Qy 5347 TGAATAAAGAATTCTTCCTGTTCA 5370 

I I I I I I I I I I I I I I I I I I I II I 
Db 2060 TGAATAAATAATTCTTCCTCTTCA 2083 


RESULT 3 
CR622709 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
REMARK 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 


COMMENT 


FEATURES 

source 


CR622709 1671 bp mRNA linear HTC 21-JUL-2004 

full-length cDNA clone CS0DI078YJ13 of Placenta Cot 25-normalized 
of Homo sapiens (human) . 
CR622709 

CR622709. 1 GI: 50503516 
HTC; CNSLT_cDNA. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 

1 (bases 1 to 1671) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 

2 (bases 1 to 1671) 
Genoscope . 

Direct Submission 

Submitted (20- JUL-2004 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : www.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 

Location/Qualifiers 

1. .1671 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DI078YJ13" 

/tissue_type="Placenta Cot 25-normalized" 
/pla smid= "pCMVS PORT_6 " 


ORIGIN 


Query Match 18 .2%; 

Best Local Similarity 83.9%; 
Matches 1320; Conservative 


Score 1034.4; DB 6; Length 1671; 
Pred. No. 5.4e-247; 
0; Mismatches 196; Indels 58; Gaps 


11; 


Qy 


3816 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 387 5 


http://es/ScoreAccessWeb/GetItem .action? Appld=088 1 9669&seqld=6 1 0474&ItemName=us. . . 8/30/06 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i II I 1 1 1 1 

Db 119 GCCTGTGGGTCCCCATTGCCCAGCTTTTGCCTGCACTCTTGCCTGCTGCCCTGACCAGAG 178 

Qy 387 6 TC ATC AT GTC T C T TGAGC AGAGGAGT C T GC AC T GC AAGC C T GAGGAAGC CC T TGAG GC C C 3935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 179 TCATCATGTCTTCTGAGCAGAAGAGTCAGCACTGCAAGCCTGAGGAAGGCGTTGAGGCCC 238 

Qy 3936 AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

II I I I I I I I I I I I I I I I I I I I I III II I I I I I II 

Db 239 AAGAAGAGGCCC TGGGCCT GGTGGGTGC ACAGGC TC C TAC TAC TGAGGAGCAGGAGGC TG 2 98 

Qy 397 6 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGT 4 031 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I II 
Db 299 CTGTCTCCTCCTCCTCTCCTCTGGTCCCTGGCACCCTGGAGGAAGTGCCTGCTGCTGAGT 358 

Qy 4032 C AACAGAT C C TC CC C AGAG T C C T C AGGGAGC CTCCGCCTTTC C C AC TAC CAT CAAC T T C A 4091 

II III I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I I I I I I I 1 I I I I 
Db 359 CAGCAGGTCCTCCCCAGAGTCCTCAGGGAGCCTCTGCCTTACCCACTACCATCAGCTTCA 418 

Qy 4092 C TC GAC AGAGGC AAC C C AG TGAGGGT TC C AGC AGC C GTGAAGAGGAGGGGC C AAGC AC C T 4151 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I 
Db 419 CT T GC TGGAGGC AAC CCAATGAGGGTTC C AGC AGCCAAGAAGAGGAGGGGCC AAGC ACC T 478 

Qy 4152 CTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTG 4211 

I I I I I M I I I I I I I II I I I I I I I I I I I I i I I I I I I I I I I I I I I 
Db 47 9 CGC C T GACGC AGAGT C CTTGTTCC GAGAAGC AC T C AGTAAC AAGGTGGAT GAGT T GGC T C 538 

Qy 4212 GTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGA 4271 

I I I I I I I I I I I III II II I II I I I I I I I I I I i I I I I I I I I I I I I I I M I I I I I I 
Db 539 ATTTTCTGCTCCGCAAGTATCGAGCCAAGGAGCTGGTCACAAAGGCAGAAATGCTGGAGA 598 

Qy 4272 GTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCT 4331 

I I I I I I I I I I I II I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 599 GAGTCATCAAAAATTACAAGCGCTGCTTTCCTGTGATCTTCGGCAAAGCCTCCGAGTCCC 658 

Qy 4332 TGC AGC T GGTC T T T GGC AT T GAC G TGAAGGAAGC AGAC C C C AC C GGC C AC T C CT AT GT C C 4391 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I II 

Db 659 TGAAGAT GATC T T TGGC AT TGAC G T GAAGGAAGT GGAC CC C GC C AGC AAC AC C TAC AC C C 718 

Qy 4392 TTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCA 4451 

I I I M I I I I I I I I II II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 719 TTGTCACCTGCCTGGGCCTTTCCTATGATGGCCTGCTGGGTAATAATCAGATCTTTCCCA 778 

Qy 4452 AGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTG 4511 

I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I II I E II IN 
Db 779 AGACAGGCCTTCTGATAATCGTCCTGGGCACAATTGCAATGGAGGGCGACAGCGCCTCTG 838 

Qy 4 512 AGGAGGAAAT C T GGGAGGAGC TGAGT GT GAT GGAGGT GTAT GAT GGGAGGGAGC AC AG T G 4571 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 
Db 839 AGGAGGAAAT C TGGGAGGAGC TGGGTGT GAT GGGGGT GTAT GAT GGGAGGGAGC AC AC TG 898 

Qy 4 572 C C T ATGG GGAGCC C AGGAAGC TGC T C AC CC AAGAT T TGGT GC AGGAAAAGT AC C T G GAGT 4 631 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 8 99 TC T ATGGGGAGCCCAGGAAAC TGC TCAC CC AAGAT TGGGT GCAGGAAAACTACC TGGAGT 958 

Qy 4 632 A-CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCC 4 690 

I I I I I I I I I II I I I I I I I I I II I I I I I I I I II II I I I I II I I II I I I I I M I 
Db 959 ACCGGCAGGTACCCGGCAGTAATCCTGCGCGCTATGAGTTCCTGTGGGGTCCAAGGGCTC 1018 

Qy 4691 TCGCTGAAACC AGC TATGTGAAAGTCCT TGAG TATGTGATCAAGGTCAGTGCAAGAGTTC 4750 

I I I I 11 I I I I I I I I I I I I I I I I I I I I I III I I I I I III I I I I I I I I I I II I I I I 


http://es/ScoreAccessWeb/GetItem .action? Appld=088 1 9669&seqld=6 1 0474&ItemName=us. . . 8/30/06 


Db 1019 TGGCTGAAACCAGCTATGTGAAAGTCCTGGAGCATGTGGTCAGGGTCAATGCAAGAGTTC 1078 

Qy 4751 GCTTTTTCTTC CC AT C C C T GC GTGAAGC AGC T T T GAGAGAGGAGGAAGAGGGAGTC TGAG 4810 

II || II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 107 9 GCAT T GC C T AC C CAT C C C T GC GTGAAGC AGC T T T GT T AGAGGAGGAAGAGGGAGTC TGAG 1138 

Qy 4811 CAT GAGT T GC AGC C AAGGC C AGTGGGAGGG GGAC T GGGC CAGTGCAC C T TCCAGGG 48 66 

I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I II I 

Db 1139 CAT GAGT TGCAGCCAGGGC TGTGGGGAAGGGGCAGGGCTGGGCC AGTGCATC TAAC A — G 1196 

Qy 48 67 CCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTC TGA 4 922 

II II I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I III 

Db 1197 CCCTGTGCAGCAGCTTCCCTTGCCTCGTGTAACATGAGGCCCATTCTTCACTCTGTTTGA 1256 

Qy 4923 AGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTA 4982 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I 
Db 1257 AGAAAATAGTCAGTGTTCTTAGTAGTGGGTTTCTATTTTGTTGGATGACTTGGAGATTTA 1316 

Qy 4983 TCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTT 5042 

Ml | | I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1317 TCTCTGTTTCCTTTTACAATTGTTGAAATG-TTCCTTTTAATGGATGGTTGAATTAACTT 1375 

Qy 5043 CAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTA 5102 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M 

Db 1376 CAGCATCCAAGTTTATGAATCGTAGTTAACGTATATTGCTGTTAATATAGTTTAGGAGTA 1435 

Qy 5103 AGAGTC TTGTGTTT TAT TC AGAT T GGGAAATC CAT T C TAT T T T G T GAAT T GGG ATAA 5159 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1436 AGAGTC TTGTTTTTTATTCAGATTGGGAAATCCGTTC TAT TTTGTGAATTTGGGAC ATAA 1495 

Qy 5160 T AAC AGC AGT GGAAT AAGT AC T T AGAAAT GT GAAAAAT GAGC AG TAAAAT AGAT GAGAT A 5219 

I I I I I I I I I I I I I MINI I I I I I I I I I I III I I I I I I I I I I I I I I I 
Db 14 96 TAACAGCAGTGGAGTAAGTATT TAGAAGTGTG AAT T C AC C G T G AAAT AG G T GAGAT - 1551 

Qy 5220 AAG AAC T AAAGAAAT T AAG AGAT AGTC AAT T C T TGC C T TAT AC C T C AG T C TAT TC T GTAA 52 7 9 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1552 AAAT TAAAAGATACTTAATTCCCGCCTTATGCCTCAGTC TAT TCTGTAA 1600 

Qy 5280 AAT T T - T T AAAGAT ATAT GC AT AC C TGGAT T T C C T T GGC T T C T T T GAGAATG T AAG AGAA 5338 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1601 AAT T T AAAAAAT AT AT ATGCAT AC C TGGAT T T CC T T GGC T TC GT GAAT GTAAGAGAA 1657 

Qy 5339 ATTAAATCTGAATA 5352 

I I I I I I I I I I I I I I 
Db 1658 ATTAAATCTGAATA 1671 


RESULT 4 
CR595748 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


REFERENCE 


CR595748 1689 bp mRNA linear HTC 21-JUL-2004 

full-length cDNA clone CS0DK007YN24 of HeLa cells Cot 2 5-normalized 
of Homo sapiens (human) . 
CR595748 

CR595748.1 GI: 5047 6555 
HTC; CNSLT_cDNA. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae ; Homo . 
1 (bases 1 to 1689) 


http://es/ScoreAccessWeb/GetItem.action? AppId-088 1 9669&seqld=6 1 0474&ItemName=us.. . 8/30/06 


AUTHORS 
TITLE 
JOURNAL 
REMARK 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 


COMMENT 


FEATURES 

source 


Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 

Faraday Avenue 

2 (bases 1 to 1689) 

Genoscope . 

Direct Submission 

Submitted (20- JUL-2004 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : www.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 

Location/Qualifiers 

1. .1689 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref ="taxon: 9606" 
/clone="CS0DK007YN24" 

/tissue_type="HeLa cells Cot 25-normalized" 
/pla smid= "pCMVS P0RT_6 " 


ORIGIN 


Query Match 18.2%; Score 1032; DB 6; Length 1689; 

Best Local Similarity 82.1%; Pred. No. 2.2e-246; 

Matches 1295; Conservative 0; Mismatches 250; Indels 33; 


Gaps 


8; 


Qy 

3816 

Db 

116 

Qy 

3876 

Db 

176 

Qy 

3936 

Db 

236 

Qy 

3975 

Db 

296 

Qy 

4035 

Db 

356 

Qy 

4095 

Db 

416 

Qy 

4155 

Db 

476 

Qy 

4215 


GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 3875 

Ml I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I M I I I M I I I I I I I I I 
GCCAGTGGGTCTCCATTGCCCAGCTCCTGCCCACACTCCCGCCTGTTGCCCTGACCAGAG 17 5 

TC AT CAT GT C T C T T GAGCAGAGGAGTC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C C 3935 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I 

T CAT CAT GC C T C T T GAGCAGAGGAGTC AGC AC T GC AAGC C T GAAGAAGGC C T T GAGGC C C 2 35 

AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCT GCCA 3974 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 
GAGGAGAGGCCCTGGGCCTGGTGGGTGCGCAGGCTCCTGCTACTGAGGAGCAGGAGGCTG 2 95 

CCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAA 4034 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCTCCTCCTCTTCTACTCTAGTTGAAGTCACCCTGGGGGAGGTGCCTGCTGCCGAGTCAC 355 

C AGAT C C T C C C C AGAGTC C T C AGGGAGC C TC C GCC T T T C C C AC T AC CAT C AAC T T C AC T C 4 094 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

C AGATCC T C C C C AGAGT C C TC AGGGAGC C TC C AGC C T C C C C AC T AC C ATGAAC T AC C C T C 415 

GAC AGAGGC AAC C C AG TGAGGGT T C C AGC AGC C GT GAAGAGGAGGGGC C AAGC AC C T C T T 4154 

Ml I M II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
TC T GGAGC C AAT C C T AT GAGGAC T C C AGC AAC C AAGAAGAGGAGGGGC C AAGC AC C T T C C 4 75 

GTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTT 4214 

I lllllllll I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 
C T GAC C T GGAG T C T GAGT T CC AAG C AGC AC T C AG T AGGAAGGT GGC C AAGT T GGT T CAT T 535 

TTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTG 427 4 
I I I I I I I I I I M I I I I M I I I I I II I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I 


http://es/ScoreAccessWeb/G^^ 8/30/06 


Db 536 TTCTGCTCCTCAAGTATCGAGCCAGGGAGCCGGTCACAAAGGCAGAAATGCTGGGGAGTG 595 

Qy 4275 TCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGC 4334 

I I I I I I II I II III I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I 
Db 596 TCGTCGGAAATTGGCAGTACTTCTTTCCTGTGATCTTCAGCAAAGCTTCCGATTCCTTGC 655 

Qy 4335 AGC T GGT C T T T GGC AT TGACGTGAAGGAAGC AGAC C C C AC CGGC C AC T C C TATGT C C T T G 4394 

I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
Db 656 AGC T GGT C T T T GGC AT C GAGC T GATGGAAGTGGAC C CC AT C GGC C AC G T G T AC AT C T T T G 715 

Qy 4 395 TCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGA 44 54 

I I I I I I I I I II I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 716 CCACCTGCCTGGGCCTCTCCTACGATGGCCTGCTGGGTGACAATCAGATCATGCCCAAGA 775 

Qy 44 55 CAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGG 4514 

I I I I I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I III I I I I I I I 

Db 776 C AGGC T T C C T GAT AATC AT CC T GGC C AT AATC GC AAAAGAGGGC GAC T GT GC CC C TGAGG 835 

Qy 4 515 AGGAAAT C T GGGAGGAGC T GAGTG TGAT GGAGGT GT AT GAT GGGAGGGAGC AC AGTGC C T 4574 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I II 

Db 836 AGAAAAT C T GGGAGGAGC T GAGT GT GT T AGAGGT GT T TGAGGGGAGGGAAGAC AGT ATC T 8 95 

Qy 4 575 AT GGGGAGC C C AGGAAGC T GC T C AC C C AAGAT T TGG TGC AGGAAAAGT AC C T GGAGTA- C 4 633 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 896 TC GGGGAT C C C AAGAAGC T GC T C AC C C AAT AT T T C G TGC AGGAAAAC T AC C T GGAGT AC C 955 

Qy 4 634 GGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCG 4 693 

I I I I I I I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 956 GGCAGGTCCCCGGCAGTGATCCTGCATGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCA 1015 

Qy 4694 CTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCT 4753 

I I I I I I I I I I I I I I I I I I I I I I I I I till I III I I I I I I I II I I I I 

Db 1016 T T GAAAC C AGC T AT GT GAAAGT CC T GC AC CAT AT GG T AAAGAT C AGT GGAGG AC C T C GC A 1075 

Qy 47 54 TTTTCTTCC CAT C CC TGC G TGAAGC AGC T T TG AGAGAGGAGGAAGAGGGAGT C T GAGC AT 4813 

Ml II I I I I I I I I I III I I I I I I M II I I I I I I I I I I I I I I I I I I I I I 

Db 107 6 T T T C C T AC C C AC T C C T GC AT GAGT GGGC T T TGAGAGAGGGGGAAGAGT GAGT C T GAGC AC 1135 

Qy 4 814 GAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTC 4873 

I I I I I I I I II I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1136 GAGTTGCAGCCAGGGCCAGTGGGAGGGGGTTTGGGCCAGTGCACCTTCCGGGGCCCCATC 1195 

Qy 4874 CAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTC — TGAAG AGAGC GG 4931 

I II I I II I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1196 CCTTAGTTTCCACTGCCTCCTGTGACGTGAGGCCCATTCTTCACTCTTTGAAGCGAGCAG 1255 

Qy 4 932 TCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTC 4991 

MM I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1256 TCAGCATTCTTAGTAGTGGGTTTCTGTTCTGTTGGATGACTTTGAGATTATTCTTTGTTT 1315 

Qy 4992 TCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCA 5051 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1316 CCTGTTGGAGTTGTTCAAATG-TTCCTTTTAACGGATGGTTGAATGAGCGTCAGCATCCA 1374 

Qy 5052 AGT T TAT GAAT GAC AGC AG T C AC AC — AGTTCTGTGTATATAGTTTAAGGGTAAGAGTCT 5109 

I I I I II I I I I I I I I I II I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1375 GGT TTATGAATGACAGTAGTCACACATAGTGC TGTT TATATAGT TTAGGAGTAAGAGTCT 1434 

Qy 5110 TGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGG — ATAATAACAGCA 5167 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I 
Db 14 35 TGT T T T T TAT T C AGAT T GGGAAAT C CAT T C C AT T T T GT GAAT T G T GAC AT AAT AAT AGC A 14 94 


http://es/ScoreAccessWeb/GetIte^^ 8/30/06 


Qy 

Db 


5168 
1495 


GTGGAAT AAGT AC T T - AGAAATGT GAAAAATGAGC AG T AAAAT AGATGAGAT AAAGAAC T 5226 
I I I I I I I I I I I I I IE I I II M I I I I I I I I I 

GTGGAAAAAGT AT T T GC T T AAAAT T GTGAGCG AAT T AGC AATAAC AT AC AT GAGAT AAC T 1554 


Qy 5227 AAAGAAATTAAGAGATAGTCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTT 5286 

I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I IE I II I I I I I I I I I I I II 
Db 1555 C AAGAAAT C AAAAGAT AGT TGAT TCTTGCCTT GT AC C TCAAT C TAT T C T GTAAAA TT 1611 

Qy 5287 AAAGATAT ATGC AT AC C TGGAT T T C C T T GGC T T C T T T GAG AAT G T AAGAGAAAT TAAAT C 5346 

Ml I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 
Db 1612 AAAC AAAT AT GC AAAC C AGGAT T T C C T T GAC T TC T T T GAGAAT GC AAGC GAAAT TAAAT C 1671 

Qy 5347 TGAATAAAGAATTCTTCC 5364 

I I I I I I I I I I I I I I I I I 
Db 1672 TGAATAAATAATTCTTCC 1689 


RESULT 5 
CR623041 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
REMARK 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 


COMMENT 


FEATURES 

source 


CR623041 1738 bp mRNA linear HTC 21-JUL-2004 

full-length cDNA clone CS0DI048YI01 of Placenta Cot 25-normalized 
of Homo sapiens (human) . 
CR623041 

CR623041. 1 GI: 505038 48 
HTC; CNSLT_cDNA. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 

1 (bases 1 to 1738) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 

2 (bases 1 to 1738) 
Genoscope . 

Direct Submission 

Submitted (20- JUL-2004 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : www.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 

Location/Qualifiers 

1. .1738 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DI048YI01" 

/tissue_type="Placenta Cot 25-normalized" 
/pla smid= " pCMVS P0RT_6 " 


ORIGIN 


Query Match 18.0%; 
Best Local Similarity 83.7%; 


Score 1022.4; DB 6; 
Pred. No. 5.5e-244; 


Length 1738; 
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Matches 1308; Conservative 0; Mismatches 196; Indels 58; Gaps 11; 


Qy 

3816 

GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 

3875 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

1 Q O 

r*r , r , rrir*rnr , r*r t Tvr t r*r*r*T\ nr>T»/*?/ ,, r*r*7\/" , PTTTTPPPTP_P7AP TP TT P_P P T fZC TP-P P P T P.7AP P HCITXCZ 
bbb iblbbb lLL-LoAl 1 bbbbAbb 1111 bLL 1 bbAb 1^11 uuu 1 uL, 1LtL*L,L» l Urtu L, HUHU 

257 

Qy 

3876 

T CAT CAT GT C T C T TGAGC AGAGGAGTC T GC AC TGC AAGC C TGAG GAAGC C C T TGAGGCC C 

3935 


1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

258 

T C ATC AT GT C T TC T G AGC AGAAGAGTC AGC AC T GC AAGC C T GAGGAAG GC GT T GAGGCC C 

317 

Qy 

3936 

AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 

3975 


II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 M 


Db 

318 

AAGAAbAbGbb b 1 bbbbb 1 bb 1 bub 1 bb AbAbbb ItLI Ab 1 Hb 1 bAbbAbbAbbAuuL* 1 Lt 

Oft 

Qy 

3976 

CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGT 

4031 

Db 

378 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 
CTGTCTbb i bb 1 bb 1 b ILL 1 b 1 bb Ibbb IbbbAbbb IwKwMblbL^ lbb 1 bL^ 1 uAu 1 

4^7 

Qy 

4032 

C AAC AGAT C C T C C C C AGAG TCC TC AGGG AGC C TC C GC C T T T C C C AC TAC CAT C AAC T TC A 

4091 


II Ml I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

438 

CAGCAGGTCCTCCCCAGAGTCCTCAGGGAGCC lb Ibbb 1 1 ALLLAL I LAbL 1 


Qy 

4092 

C T C GAC AGAGGC AAC C C AG TGAGGGT T C C AGC AGC C GT GAAGAGGAGGGGCC AAGC AC C T 

4151 


II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

498 

C T T GC T G GAGG C AAC C C AAT GAGG GT T C C AGC AGO b AAbAAb Ab bAbbbbt b AAb b AL b 1 

^^7 

Qy 

4152 

CTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTG 

4211 


I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

558 

C GC C T GACGC AGAGT CCTTGTTCC GAG AAGC AC T C AGT AAC AAGG 1 bbA 1 bAb 1 1 bbb i b 

D± / 

Qy 

4212 

GT T T T C T GC TC C T C AAAT AT CGAGCC AGGGAGC C AG T C AC AAAGGC AG AAAT GC TGGAGA 

4271 


1 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

618 

■n m m m m s*t m r+ r~* m ft ri *-* t\ T\ f"* m TV m /~* r~* TV /~* ^» TV TV /~* /~* TV IT) /"* rn TV /"~< TV TV TV TV Z^"" 1 TV TV TV rp /"""■ /"^ rp/^ 1 f"* TV TV 

ATTTTCTGCTCCGCAAGTATCGAGCCAAGGAbb 1Gb lbAbAAAbbbAbAAAlbb IbbAbA 


Qy 

4272 

GTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCT 

4331 


1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

678 

GAGTCATCAAAAATTAC AAGC GCTGCTTTCCTGTGATCTTCGGCAAAbbb IbbbAb ibbb 

TOT 

Qy 

4332 

T GC AGC T GGT C T T TGGC AT TGAC G T GAAGGAAGC AGAC C C C AC C GGC C AC TCC TAT GT C C 

4391 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 


Db 

738 

T GAAGAT GAT C T T T G Gb AT T GAC b 1 bAAbbAAb 1 bb Ab b b b bb b Abb AAb Ab b 1 Ab Ab b b 

*7 Q 7 
f y f 

Qy 

4392 

TTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCA 

4451 


I I 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

7 98 

TTGTCACCTGCCTGGGCC I 1 lbb i AlbAibbbb Ibb Ibbb 1 AA1 AAlbAbAl bill bbbA 

ft ^7 

Qy 

4452 

AGAC AGGC T T C C T GAT AAT TGTCC T GGT CAT GAT T GC AAT GGAGGGC GGC CAT GC T C C TG 

4511 


I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I III 


DD 

o c o 

AbAbAbbbb 1 1 b 1 bAl AA1 bbl bb IbbbbAbAAi 1 bbAAl uvjAuubLbHL-H.uL.uLo lL-lu 

917 

Qy 

4512 

AGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTG 

4571 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 


DO 

y io 

7\r , r , 7\rr7\7\7\'pr ,r rrrr ta pp Ti P P TP PP TP TP. H r P(Znn(Zn r V(Z T ri^ TP- T^^CZCZfZHCZC^CZTXCZC ZAP DPTf^ 
AbbAbbAAAl b 1 bbbAbbAbb 1 bbb 1 b 1 bAl uuubu 1 b 1 Al bAl uuLjHuLjuAuL.HL.rtL- J- u 

977 

Qy 

4572 

CCTATGGGGAGCCCAGGAAGC lbb IbAbbbAAbAl 1 Ibbl bbAbbAAAAblAbb IbbAbl 

4 DO i 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

978 

TCTATGGGGAGCCCAGGAAACTGCTCACCCAAGATTGGGTGCAGGAAAACTACCTGGAGT 

1037 

Qy 

4632 

A-CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCC 

4690 



I 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

1038 

ACCGGCAGGTACCCGGCAGTAATCCTGCGCGCTATGAGTTCCTGTGGGGTCCAAGGGCTC 

1097 
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Qy 4 691 TCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTC 47 50 

I I I I I II I I I I I I I I I I I I I I I I I I I I III I I I I I Ml I I I I I I I I I I I I I I I I 

Db 1098 TGGCTGAAACCAGCTATGTGAAAGTCCTGGAGCATGTGGTCAGGGTCAATGCAAGAGTTC 1157 

Qy 4751 GCTTTTTCTTCC CAT CCC T GC GT GAAGC AGC T T T GAGAGAGGAGGAAGAGGGAGT C TGAG 4810 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 1158 GCAT TGC C T AC C CAT C CC T GC GT GAAGC AGC T T T G T TAGAGGAGGAAGAGGGAGTC T GAG 1217 

Qy 4811 CATGAGT TGCAGCCAAGGCCAGTGGGAGGG G G AC T GGGC C AG T GC AC C T T C C AGG G 48 66 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I M I 

Db 1218 CATGAGT TGCAGCCAGGGCTGTGGGGAAGGGGCAGGGCTGGGCCAGTGCATCTAAC A — G 1275 

Qy 4867 CCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTC TGA 4922 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 1276 CCCTGTGCAGCAGCTTCCCTTGCCTCGTGTAACATGAGGCCCATTCTTCACTCTGTTTGA 1335 

Qy 4923 AGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTA 4982 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 
Db 1336 AGAAAAT AGTC AGT G T T C T T AGTAGT GGGT T TC T AT T T T G T TGGATGAC T T GGAGAT TTA 1395 

Qy 4 983 TCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTT 5042 

III I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I 

Db 1396 TCTCTGTTTCCTTTTACAATTGTTGAAATG-TTCCTTTTAATGGATGGTTGAATTAACTT 1454 

Qy 5043 CAGCATC CAAGT T TATGAATGACAGCAGTCAC ACAGT TC TGTGT ATATAGTT TAAGGGTA 5102 

I I I I I I II I I I I Ill II I I I I I I I I I I I I I I I I I I I I I I 

Db 1455 CAGC ATC C AAG T T TAT GAAT CGT AGT TAAC G TAT AT T GC T GT T AAT AT AG TT T AGGAGTA 1514 

Qy 5103 AGAGTC T T GTG T T T T AT TC AGAT T GGGAAAT C C AT TC T AT T T T G T GAAT T GGG ATAA 5159 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1515 AGAGTCTTGTTTTTTATTCAGATTGGGAAATCCGTTCTATTTTGTGAATTTGGGACATAA 157 4 

Qy 5160 TAACAGC AGTGGAAT AAGT AC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATA 5219 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I III I II MINI I I I I I I 

Db 1575 TAAC AGC AGTGGAGT AAGT AT T T AGAAG T GT G AATTCACCGTGAAATAGGTGAGAT- 1630 

Qy 5220 AAGAAC T AAAGAAAT T AAG AGAT AGTC AAT T C T TGC C T TAT AC C T C AG T C TAT T C T GT AA 5279 

I I I I I I I Mill I II I I I I I II I II I I I I I I I I II I II II I I I 
Db 1631 AAATTAAAAGATACTTAATTCCCGCCTTATGCCTCAGTCTATTCTGTAA 167 9 

Qy 5280 AAT T T - T T AAAGAT AT ATGC AT AC C TGGAT T T C C T TGGC T T C T T T GAGAATGTAAG AGAA 5338 

I I I I I I II I I I I I I I I II I I I I II I I I I I I I I I M I II I II I II I II II II I 
Db 1680 AAT T T AAAAAAT AT AT AT GC AT AC C T GG AT T T C C T T GGC T TC GTGAATGTAAGAGAA 1736 

Qy 5339 AT 5340 

I I 

Db 1737 AT 1738 


RESULT 6 
CR611124 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


CR611124 1661 bp mRNA linear HTC 21-JUL-2004 

full-length cDNA clone CS0DC020YG12 of Neuroblastoma Cot 
2 5 -normalized of Homo sapiens (human) . 
CR611124 

CR611124.1 GI: 504 91931 
HTC; CNSLT_cDNA. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
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REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
REMARK 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 


COMMENT 


FEATURES 

source 


Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 

1 (bases 1 to 1661) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 

2 (bases 1 to 1661) 
Genoscope . 

Direct Submission 

Submitted (20- JUL-2004 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : www.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 

Location/Qualifiers 

1. .1661 

/organism="Homo sapiens" 
/mo 1_ t yp e = " mRNA" 
/db_xref ="taxon: 9606" 
/clone="CS0DC020YG12" 

/tissue_type="Neuroblastoma Cot 25-normalized" 
/pla smid= "pCMVS P0RT_6 " 


ORIGIN 


Query Match 17.8%; Score 1008.6; DB 6; Length 1661; 

Best Local Similarity 81.8%; Pred. No. 1.6e-240; 

Matches 1271; Conservative 0; Mismatches 249; Indels 33; Gaps 


8; 


Qy 

3816 

Db 

113 

Qy 

3876 

Db 

173 

Qy 

3936 

Db 

233 

Qy 

3975 

Db 

293 

Qy 

4035 

Db 

353 

Qy 

4095 

Db 

413 

Qy 

4155 

Db 

473 


GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 3875 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
GCCAGTGGGTCTCCATTGCCCAGCTCCTGCCCACACTCCCGCCTGTTGCCCTGACCAGAG 172 

TC AT CAT G T C T C T TGAGC AGAGGAGTC T GC AC TGC AAGC C T GAGGAAGC C C T T GAGGC C C 3935 

I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I 

TC AT CAT GC C T C T TGAGC AGAGGAGT C AGC AC T GC AAGC C T GAAGAAGGC C T TGAGGC C C 232 

AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCT GCCA 3974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
GAGGAGAGGCCCTGGGCCTGGTGGGTGCGCAGGCTCCTGCTACTGAGGAGCAGGAGGCTG 2 92 

CCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAA 4034 

I I I I I I I I I I III I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCTCCTCCTCTTCTACTCTAGTTGAAGTCACCCTGGGGGAGGTGCCTGCTGCCGAGTCAC 352 

CAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTC 4094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IN 
C AGAT C C TC C C C AGAGT C C T C AGGGAGC C TC C AGC C TC C C C AC T AC CAT GAAC T AC C C TC 412 

GAC AGAG GC AAC C C AGT GAGGGT T CC AGC AGC C G T GAAGAGGAG GGGC C AAGC AC C T C T T 4154 

III III II I I I I I I I I I I I I II I I I I I I I II I I II I I I I I I I I I 
T C T GGAGC C AAT C C T ATGAGGAC T C C AGC AAC C AAG AAGAGGAGGGGC C AAGC AC C T T CC 472 

GTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTT 4214 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 
CTGACCTGGAGTCTGAGTTCCAAGCAGCACTCAGTAGGAAGGTGGCCAAGTTGGTTCATT 532 
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Qy 4215 TTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTG 4274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 533 TTCTGCTCCTCAAGTATCGAGCCAGGGAGCCGGTCACAAAGGCAGAAATGCTGGGGAGTG 592 

Qy 427 5 TCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGC 4 334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 593 TCGTCGGAAATTGGCAGTACTTCTTTCCTGTGATCTTCAGCAAAGCTTCCGATTCCTTGC 652 

Qy 4335 AGC T GGT C T T T GGC AT TGACGT GAAGGAAGC AGAC C C C AC C GGC C AC T C C T ATGT CC T T G 4394 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 653 AGCTGGTCTTTGGCATCGAGCTGATGGAAGTGGACCCCATCGGCCACGTGTACATCTTTG 712 

Qy 4395 TCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGA 4454 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 713 CCACCTGCCTGGGCCTCTCCTACGATGGCCTGCTGGGTGACAATCAGATCATGCCCAAGA 772 

Qy 4455 CAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGG 4514 

I I I II I I I I I I I I I I I I I I I I I III II I I I I I I I I M I I Ml I I I I I I I 

Db 773 CAGGCTTCCTGATAATCATCCTGGCCATAATCGCAAAAGAGGGCGACTGTGCCCCTGAGG 8 32 

Qy 4515 AGGAAAT C TGGGAGGAGC T GAGTG T GAT GGAGGTGT AT GAT GGGAGGG AGC AC AG T GC C T 4574 

II I I I I I I I I I I I I I I I M I I I I I I I M I I I 1 I III I I I I I I I I I I I I I II 

Db 833 AGAAAAT C TGGGAGGAGC T GAGTG TGT T AGAGGTGT T T GAGGGGAGGGAAGAC AGT AT C T 892 

Qy 4575 AT GGGGAGC CC AGGAAGC T GC T C AC C C AAGAT T TGG TGCAGGAAAAGT AC C T GGAG T A- C 4633 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 893 TC GGGGAT C C C AAGAAGC T GC T C AC CC AATAT T TC G TGC AGGAAAAC T AC C T GGAG T ACC 952 

Qy 4 634 GGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCG 4693 

I I I I I I I II I I I I I I I I I I III I I I I I I I I II I I I I I I I I I M I I I I I I I I II I 
Db 953 GGCAGGTCCCCGGCAGTGATCCTGCATGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCA 1012 

Qy 4694 CTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCT 4753 

I I [ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1013 T T GAAAC C AGC T AT GT GAAAGTC C T GC AC CAT AT GG T AAAGAT C AGT GGAGGAC C T C GCA 1072 

Qy 4754 TTTTCTTCC CAT C CC T GC G T GAAG C AGC T T TG AGAG AGGAGGAAGAGGGAG T C T GAGC AT 4813 

Ml II I I I I I I I I I Ml I I I I II I I II II I I I II II I I I I I II I I I I I 

Db 1073 T T T CC T AC C C AC TC C T GC AT GAGT GGGC TT T G AGAGAGGGGGAAGAGT GAGT C T GAGC AC 1132 

Qy 4814 GAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTC 4873 

I II II I I I II I I I I I I I I II I I I I I II I I I I I I II I I I II I II I I I I I II I I II 
Db 1133 GAGTTGCAGCCAGGGCCAGTGGGAGGGGGTTTGGGCCAGTGCACCTTCCGGGGCCCCATC 1192 

Qy 4874 CAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTC — TGAAGAGAGCGG 4931 

I II I I IE I I I I I I I I II I I I I I I I I I II I I II I I I II II II I I I MM I 
Db 1193 CCTTAGTTTCCACTGCCTCCTGTGACGTGAGGCCCATTCTTCACTCTTTGAAGCGAGCAG 1252 

Qy 4932 TCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTC 4991 

I I I I I I I I I II II I I I M I I II II I I I II I I I I I I I I I I II I II I I I I I I 
Db 1253 TCAGCATTCTTAGTAGTGGGTTTCTGTTCTGTTGGATGACTTTGAGATTATTCTTTGTTT 1312 

Qy 4992 TCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCA 5051 

II I I I II I I I I II I I I II II II I M I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 1313 CCTGTTGGAGTTGTTCAAATG-TTCCTTTTAACGGATGGTTGAATGAGCGTCAGCATCCA 1371 

Qy 5052 AGT TTATGAAT GACAGCAGTC AC AC — AGTTCTGTGTATATAGTTTAAGGGTAAGAGTCT 5109 

I I I I I I I II I I I II I I I II II I I III I I I I II I I II I I I I I I I M I I I I I I I 
Db 1372 GGT T TATGAAT GAC AGTAGTCACACATAGTGC TGT T TAT AT AGT T TAGGAGT AAGAGTCT 1431 
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Qy 5110 TGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGG — ATAATAACAGCA 5167 

III I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 1432 T GT T T T T TAT T C AGAT TGGGAAAT CC AT T C CAT T T T GT GAAT TG T GAC AT AAT AAT AGC A 1491 

Qy 5168 GTGGAAT AAGT ACTT - AGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAAAGAAC T 5226 

I I I I I I I I I I I I I II I I M M IN I I I I I I 

Db 1492 GTGGAAAAAGT AT T T GC T T AAAAT TGT GAGCGAAT T AGC AAT AAC AT AC AT GAGAT AAC T 1551 

Qy 5227 AAAGAAAT TAAGAGAT AGT C AAT T C T T GC C T TAT AC C T C AGTC TAT T C TGTAAAAT T T T T 5286 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1552 CAAGAAATCAAAAGATAGTTGATTCTTGCCTTGTACCTCAATCTATTCTGTAAAA TT 1608 

Qy 5287 AAAGAT ATATGC AT AC C T GGATT T CC T T GGC T TC T T TGAG AAT G TAAGAGAAA 5339 

Ml I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I Ml I M I 
Db 1609 AAAC AAAT ATGC AAAC C AGGAT T T CC T TGAC T T C T T TGAG AAT G C AAGC GAAA 1661 
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DQ034885 930 bp DNA linear GSS 02-JUN-2005 

Homo sapiens MAGEA1 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
DQ034885 

DQ03488 5.1 GI: 6688 60 94 
GSS. . 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 

1 (bases 1 to 930) 

Nielsen,R., Bustamante, C . , Clark, A. G., Glanowski, S . , Sackton, T . B . , 
Hubisz, M. J. , Fledel-Alon, A. , Tanenbaum, D . M. , Civello, D. , 
White, T. J., Sninsky, J. J. , Adams, M.D. and Cargill,M. 
A Scan for Positively Selected Genes 
Chimpanzees 

(er) PLoS Biol. 3 (6), E170 (2005) 
15869325 

2 (bases 1 to 930) 

Nielsen, R. , Bustamante, C . , Clark, A. G. 

Hubisz, M.J. , Fledel-Alon, A. , Tanenbaum, D . M. , Civello, D., 
White, T.J. , Sninsky, J.J. , Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 05-MAY-2005 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. Translation starts at the beginning of 
alignment . 

Location/Qualifiers 

1. .930 

/organism="Homo sapiens" 
/mol_type="genomic DNA" 
/db_xref="taxon:9606" 
/chromosome="X" 
<1. .>930 
/ gene="MAGEAl" 
/locus_tag="HC4290" 


in the Genomes of Humans and 


Glanowski, S . , Sackton, T. B. , 


ORIGIN 


Query Match 16.2%; Score 918; DB 14; Length 930; 

Best Local Similarity 99.9%; Pred. No. 6.6e-218; 
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Matches 929; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 3881 ATG TC T C TTGAGC AGAGGAGT C TGC AC T GC AAGCC T GAGGAAGC C C T T GAGGCC C AAC AA 3940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 AT G T C T C TTGAGC AGAGGAGT C TGC AC T GC AAGCC T GAGGAAGC C C T T GAGGCC C AAC AA 60 

Qy 3941 GAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTG 4000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I t I I I I I I I I 
Db 61 GAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTG 120 

Qy 4001 GGC AC C C TGGAGGAGGT GC C C AC T GC T GGGT C AAC AGATC C T C C C C AGAGT C C T C AGGGA 4060 

I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I 
Db 121 GGC AC C C TGGAGGAGGTGC C C AC T GC T GGGTC AAC AGATC C T C C C C AGAGTC C TC AGGGA 180 

Qy 4061 GC C T CC GCC T T T C C C AC T AC C AT C AAC T TC AC TC GAC AGAGGC AACC C AGT GAGGG T T C C 4120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GCCTCCGCCTTTCCCACTACCATCAACTTCACTCGACAGAGGCAACCCAGTGAGGGTTCC 24 0 

Qy 4121 AGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCA 4180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 AGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCA 300 

Qy 4181 GTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGG 4240 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I 
Db 301 GTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGG 360 

Qy 4241 GAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTT 4300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I LI I 1 I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAGC C AG TCAC AAAGGC AG AAAT GC T GGAGAG TGTC ATC AAAAAT TAC AAGC AC T G TT T T 420 

Qy 4 301 CCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAG 4 360 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 421 C C T GAGAT C T T CGGC AAAGC C TC T GAGT C C T T GC AGC T GG TC T T T GGC AT T GAC GT GAAG 480 

Qy 4 361 GAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGAT 4 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I 
Db 481 GAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGAT 540 

Qy 4421 GGC C TGC T GGG TGAT AAT C AGAT C ATGC C C AAGAC AGGC T TC C T GAT AAT T G TC C T GGT C 4480 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 541 GGC C TGC T GGG TGAT AAT C AGAT C ATGC C C AAGAC AGGC T T C C T GAT AAT TG T C C T GGT C 600 

Qy 4481 AT G AT TG C AAT GGAGGGC GGC CAT GC T C C T GAGGAGGAAATC TGGGAGGAGC TGAG T GT G 4540 

I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I E I I M I I I I I I I I I II I I I I I I 
Db 601 AT GAT T GCAAT GGAGGGC GGC CAT GC TC C TGAGGAG GAAAT C T GGGAGGAGC T GAG T GTG 660 

Qy 4 541 ATGGAGGTGTATGAT GGGAGGGAGCACAGTGC CTAT GGGGAGCC CAGGAAGC TGC T CACC 4 600 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I 
Db 661 ATGGAGG T GTAT GAT GGGAGGGAG C AC AGTGC C TAT GGGGAGC C CAGGAAGC T GC T C AC C 720 

Qy 4 601 CAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCA 4 659 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I i 
Db 721 CAAGATTTGGTGCAGGAAAAGTACCTGGAGTACCGGCAGGTGCCGGACAGTGATCCCGCA 780 

Qy 4660 CGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTT 4719 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 781 CGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTT 840 

Qy 4720 GAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCA 4779 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I M I I I I I I I I 
Db 841 GAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCA 900 
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Qy 4780 GCTTTGAGAGAGGAGGAAGAGGGAGTCTGA 4809 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GCTTTGAGAGAGGAGGAAGAGGGAGTCTGA 930 
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BM459064 1020 bp mRNA linear EST 05-FEB-2002 

AGENCOURT_64144 60 NIH_MGC_72 Homo sapiens cDNA clone IMAGE : 5557380 
5 ' , mRNA sequence . 
BM459064 

BM459064.1 GI: 18508104 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 

Hominidae; Homo. 

1 (bases 1 to 1020) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: ATCC/DCTD/DTP 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http: //image. llnl.gov 

Plate: LLAM12278 row: k column: 13 

High quality sequence stop: 605. 
Location/Qualifiers 
1. .1020 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref ="taxon: 9606" 

/clone="IMAGE: 5557380" 

/tis sue_type= "melanotic melanoma " 

/lab_host="DH10B (phage-resistant ) " 

/clone_lib="NIH_MGC_72" 

/note="Organ: skin; Vector: pCMV-SPORT6; Site_l: NotI; 
Site_2: Sail; Cloned unidirectionally . Primer: Oligo dT. 
Average insert size 2 kb. Library constructed by Life 
Technologies . " 


ORIGIN 


Query Match 14.8%; 
Best Local Similarity 97.8%; 
Matches 87 0; Conservative 


Score 840.2; DB 2; 
Pred. No. 2.1e-198; 
0 ; Mi sma t che s 18; 


Length 1020; 


Indels 


2 ; Gaps 


2; 


Qy 


Db 


4411 C TC C TAT GATGGCC TGC TGGGTGATAAT C AGATCATGCCCAAGACAGGC TTC C TGATAAT 4470 

I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I 
1 CTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAAT 60 


Qy 4471 TGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGA 4530 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGA 120 
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Qy 4531 GCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAA 4 590 

I I I I I I I II I II I I I I I I I I t I I I I I I I I I I I I i t I II II II I I I I I I I I I I I t I I I I I I 
Db 121 GCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAA 180 

Qy 4 591 GCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAG 4 64 9 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I II I I I I I I I I I I II I I I I I I I I I I I I II 
Db 181 GC T GC TC AC CC AAGAT T TGGTGC AGGAAAAGT AC C T GGAG TAC C GGC AGGT GCC GG AC AG 240 

Qy 4 650 TGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGT 4709 

I I I I II I I I I I I I I I I I I I II I I I II I I I I II II I I I I I I I I I I I I 1 M I I I I I I I I I I 
Db 241 TGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTTGCTGAAACCAGCTATGT 300 

Qy 4710 GAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCT 4769 

I I | I I I I I I I I I I I I I I I I II I I I I I I I I 1 I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCT 360 

Qy 4770 GCGTGAAGCAGCTTTGAGAGAGGAGGAAGAGGGAGTC TGAGCATGAGT TGC AGCCAAGGC 4829 

I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I M I I I I I I M I I I I I I I I I M I I III 
Db 361 GCGTGAAGCAGC TT TGAGAGAGGAGGAAGAGGGAGT C TGAGCAT GAGT TGCAGCC AGGGC 420 

Qy 4830 CAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGC 4889 

M I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I M I I I II I I I I I I I I I I I I 
Db 421 CAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGC 480 

Qy 4 8 90 CTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCAGTGTTCTCAGTAGTA 4 949 

I || I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I M I I I 
Db 481 CTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCAGTGTTCTCAGTAGTA 540 

Qy 4 950 GGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAA 5009 

I | | I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I ' 
Db 541 GGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAN 600 

Qy 5010 ATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTTTATGAATGACAGCA 5069 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AT GTTTTTTTT TAAGGGAT GGT TGAAT G AAC T T C AGC ATC C AAG T T TAT GAAT GAC AGC A 660 

Qy 5070 GTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGG 5129 

Ml | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GTCGCACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGNG 720 

Qy 5130 AAATCC AT T C TAT T T TGT GAAT T G GGAT AAT AAC AGC AGT GGAAT AAG TAC T T AGAAAT G 5189 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AAAT CC AT T C TAT T T T GT GAAT T GGGAAC AT AAC AGC AGT GGAAT AAG TAC T T TAG AAT G 780 

Qy 5190 T GAAAAAT GAGC AGT AAAAT AGAT GAGAT AAAGAAC T AAAGAAAT T AAGAGAT AG T C AAT 5249 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 TNGAAAATGAGCANGTAAATAGATGAGATAAAGAACTANAGAAATTAAGAGATAGTCAAT 840 

Qy 5250 TCTTGCC-TTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATATATGC 5298 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I M I I I 
Db 841 TCT TGCC TTTATACC TCCGCCTAT TCTGTAAAATTT TTAAAGAT ATAT GC 890 
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DQ034886 
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KEYWORDS 


DQ034886 923 bp DNA linear GSS 02-JUN-2005 

Pan troglodytes MAGEA1 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
DQ034886 

DQ034 88 6. 1 GI: 66886095 
GSS. 
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SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 


TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 


TITLE 
JOURNAL 

COMMENT 


FEATURES 

source 


gene 


Pan troglodytes (chimpanzee) 
Pan troglodytes 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Pan. 

1 (bases 1 to 923) 

Nielsen,R., Bustamante, C . , Clark, A. G . , Glanowski, S . , Sackton, T . B . , 

Hubisz, M.J. , Fledel-Alon, A. , Tanenbaum, D.M. , Civello, D. , 

White, T.J. , Sninsky, J. J. , Adams, M.D. and Cargill,M. 

A Scan for Positively Selected Genes in the Genomes of Humans and 

Chimpanzees 

(er) PLoS Biol. 3 (6), E170 (2005) 
15869325 

2 (bases 1 to 923) 

Nielsen, R., Bustamante, C . , Clark, A. G., Glanowski, S . , Sackton, T . B . , 
Hubisz, M.J. , Fledel-Alon, A. , Tanenbaum, D.M. , Civello, D . , 
White, T.J. , Sninsky, J.J. , Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 05-MAY-2005 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. Translation starts at the beginning of 
alignment . 

Location/Qualifiers 

1. .923 

/organism="Pan troglodytes" 

/mol_type= "genomic DNA" 

/db_xref="taxon:9598" 

<1. .>923 

/ gene="MAGEAl " 

/locus_tag="HC42 90" 


ORIGIN 


Query Match 13. 9%; 

Best Local Similarity 87.0%; 
Matches 803; Conservative 


Score 787.2; DB 14; 
Pred. No. 3.8e-185; 
0; Mismatches 119; 


Length 92 3; 


Indels 


1 ; Gaps 


l; 


Qy 

3884 

Db 

1 

Qy 

3944 

Db 

61 

Qy 

4004 

Db 

121 

Qy 

4064 

Db 

181 

Qy 

4124 

Db 

241 

Qy 

4184 

Db 

301 


1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I II 

T C T C TT GAGC NNNGGAGTC T GNNN TNC AAGNC T GAGGAAGC C C T T GAGGNNC AANANAAG 60 

GCCCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGC 4003 
I I I I I I I I I I I I I I I I I 

GC C C TGG GC C T GNT G TGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 120 

AC C C TGGAGGAGG T GC C C AC T GC T GGGT C AAC AGAT CC T C C C C AGAGT C C T C AGGGAGC C 4063 

I I I I I I I I I I I I 

NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCTCAGGGAGCC 180 

TCCGCCTTTCC C AC T AC CAT C AAC T TC AC T C GAC AGAGGC AAC C C AGT GAGG GT TC C AGC 4123 

I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCGCCTTTCCCACTACCATCAACTTCACTCGCCAGAGGCAACCCATTGAGGGTTCCAGC 2 40 

AGC CGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC GAGC AGTA 4183 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCCGTGAAGAGGAGGGGCCAAGCACCTCTCGTATCCTGGAGTCCTTGTTCCGAGCAGTA 300 

ATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAG 4243 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAG 360 
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Qy 

4244 

CCAGTCACAAAGGC AGAAA 1 GL 1 bbAGAb ibl LAI i alaallal Hjiiii^i 



M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 j 1 M 

I | | M 1 1 1 1 1 II 1 M 1 M 1 1 1 1 1 1 1 M II 1 1 1 1 M M 1 1 1 1 II f 1 1 1 II II 1 II 1 1 II M 


Db 

361 

C C AGT CAC AAAGGC AGAAATGC TGGAGAGT GT C AT C AAAAAT T AC AAGCAC T GT T T TC C T 

420 

Qy 

4304 

GAGATCTTCGGCAAAGCCTCTGAGILL 1 lbCAbtlbbRl 1 ibbLAl ibALuiuBrtboMH 



i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 1 t 1 1 1 I 

I | | | 1 | | | | 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

421 

GTGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGAGGTGAAGGAA 

480 

Qy 

4364 

— - — - --^ sift -r\ s-* /-< r~+ t\ r** m r~* /~* m t\ m m /~* rn m rn r~* 7\ r* c* rn rn 7\ f** T 1 H" 1 T 1 f~* T 1 TV T* r~* 7\ T , /""*/"^.f*"' 

GCAGACCCCACCGGCCACTCCTATGTCC 1 ibl CALL IbLL lAbblLlL ILL 1 AlbAlbbb 

d d ? "3 


i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i < I I I I I I I I I I I I t I I I I I 1 1 1 1 1 1 
I | | | | | 1 | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

481 

GCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTACGATGGC 

540 

Qy 

4424 

CTGCTGGGTGATAATCAGATCATGCCCAAbALAbbb 1 ILLlbAlAAi lb- ILL Hjb-iL.tt.Hj 

440 j 


i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i 

1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

541 

CTGCTGGGAGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATG 

600 

Qy 

4484 

AT T GC AAT GGAGGGC GGC C AT GCTCCT G AGb AbbAAA 1 L 1 bbbAbbAbb 1 bAL ibi bA i b 

H D *1 O 


■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i I i i I I I I I I I I I t I I I I 1 1 
I | | | 1 1 1 1 1 1 1 II 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 'I 1 


Db 

601 

AT T GC AATGGAGGGC GGCC ATGC T C C T GAGGAGGAAAT C T GGGAGGAGC T GAGT GT GATG 

660 

Qy 

4544 

GaGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGlCCAGGAAGl ILL 1LALLLAA 



I I I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

661 

GAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAA 

720 

Qy 

4604 

GATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGLAbb 1 bbbbbALAb 1 LAI LLLbLALbL 



,,111111 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

721 

GATTTGGTGCAGGAAAAGTACCTGGAGTACCGGCAGGTGCCGGACAGTGATCCCGCACGC 

780 

Qy 

4663 

TATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACLAGLlAlblbAAALlLL 1 ILAb 

H f c. £ 


• i i ■ i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i 
I | | | | | | 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

781 

TATGAGTNNCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAANNNCTTGAG 

840 

Qy 

4723 

TATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCT 

4782 


M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 MM 


Db 

841 

TAT GT GAT CAAGGT CAGTG CAAGAGTT C GC T T T T T C NTC C CATC C L 1 b L b 1 LAN bJNJ AbL l 

onn 

Qy 

4783 

TTGAGAGAGGAGGAAGAGGGAGT 4805 


Db 

901 

I M 1 II II II 1 1 II 1 II 1 1 1 M 1 
TTGAGAGAGGAGGAAGAGGGAGT 923 



RESULT 10 

CR619399 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
REMARK 


CR619399 1739 bp mRNA linear HTC 21-JUL-2004 

full-length cDNA clone CS0DI079YD09 of Placenta Cot 25-normalized 
of Homo sapiens (human) . 
CR619399 

CR619399.1 GI:50500206 
HTC; CNSLT_cDNA. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 
1 (bases 1 to 1739) 

Li/W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 
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REFERENCE 2 (bases 1 to 1739) 
AUTHORS Genoscope . 
TITLE Direct Submission 

JOURNAL Submitted (20- JUL-2004 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : www.genoscope.cns.fr) 
COMMENT 1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 

end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 
FEATURES Location/Qualifiers 
source 1 . . 1739 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DI07 9YD09" 

/tissue_type="Placenta Cot 25-normalized" 
/plasmid="pCMVSPORT_6" 

ORIGIN 

Query Match 13.8%; Score 783.6; DB 6; Length 1739; 

Best Local Similarity 77.1%; Pred. No. 3.6e-184; 

Matches 1190; Conservative 0; Mismatches 244; Indels 110; Gaps 15; 

Qy 3816 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 3875 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 151 GCCTGTGGGTCTCAATTGCCCAGCTCCGGCCCACACTCT — CCTGCTGCCCTGACCTGAG 2 08 

Qy 3876 TC AT C AT GTC T C T T G AGC AGAGGAGTC T GC AC T GC AAGC C T GAGGAAGC CC T TGAGGC C C 3935 

I I I I I I I I EMM I I I II II I II M II MM I I II I II II II I I I I I I II 

Db 209 TCATCATGCTTCTTGGGCAGAAGAGTCAGCGCTACAAGGCTGAGGAAGGCCTTCAGGCCC 268 

Qy 3936 AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCA 397 4 

II I I II I I I I I II II I I I II I I I I M 

Db 2 69 AAGGAGAGGC ACC AGGGC T TAT GGAT GT GC AG AT T C CC AC AGC T GAGG AGC AGAAGGC TG 328 

Qy 3975 CCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAA 4034 

I M I I I I II I I II I I I I I II I I II II I II I I I II I I I I I I I I II I I I I 

Db 329 C AT CC T C C T C C TC T AC TC T GATC AT GGGAAC C C T T GAGGAGGT G AC T GAT T C T GGGT C AC 388 

Qy 4035 CAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTC 4094 

II I I I II II I I II I M I I M I I II II I I I I I III II I I I I I II I 

Db 38 9 CAAGTCCTCCCCAGAGTCCTGAGGGTGCCTCCTCTTCCCTGACTGTCACCGACAGCACTC 448 
Qy 4095 GACAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCT 4151 

III III II II I I II II I II I I I I I I I M II I II I II II I M I II I I I 

Db 44 9 T GT GGAGC C AATC C GAT GAGGGTT C C AG C AGC AAT GAAGAGGAGGGGC C AAGC AC C T C C C 508 

Qy 4152 CTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATT 4205 

I I I I I II I I M I II II I I I I II I I I I M I I I II I II I I 
Db 509 C GG AC C C AGC T C AC C TGGAGTC CC TGT T C C GGGAAG C AC T TGAT GAGAAAGT GGC T GAGT 568 

Qy 420 6 TGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGC 4265 

I Ml II I I I I M I II II I II I II I I II II II II I II II II II I II I I I II 
Db 569 TAG TTCGTTTCCTGCTC C GC AAAT ATC AAAT T AAGGAGC C GGT C AC AAAGGC AGAAATGC 628 

Qy 4266 TGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTG 4325 

I I II I I II II II I I II I I II II I II II II II I II I I II I II I I I I I I I I M II 
Db 62 9 TTGAGAGTGTCATCAAAAATTACAAGAACCACTTTCCTGATATCTTCAGCAAAGCCTCTG 688 
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Qy 4326 AGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCT 4385 

III I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 68 9 AGTGCATGCAGGTGATCTTTGGCATTGATGTGAAGGAAGTGGACCCTGCCGGCCACTCCT 748 

Qy 438 6 ATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCA 4 445 

I I I I I I I I I I I I 1 I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 749 ACATCCTTGTCACCTGCCTGGGCCTCTCCTATGATGGCCTGCTGGGTGATGATCAGAGTA 808 

Qy 44 4 6 TGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATG 4 505 

I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 809 CGCCCAAGACCGGCCTCCTGATAATCGTCCTGGGCATGATCTTAATGGAGGGCAGCCGCG 868 

Qy 4506 C T C C T GAGGAGGAAATC T GGGAGGAGC T GAGT GTGAT GGAGGTG T ATGATGGGAGGGAGC 4565 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I i I I I II I I I I I I I 
Db 8 69 C C C C GGAGGAGGC AATC T GGGAAGCAT T GAGT GTGAT GGG GC TG T ATGATGGGAGGGAGC 928 

Qy 4566 AC AGTGC C TAT GGGGAGC C CAGGAAGC T GC TC ACCC AAGAT T T GGTGC AGGAAAAG TAC C 4 625 

I I I I I I I I I I II III I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I 
Db 929 ACAGTGT C TAT TGGAAGC TCAGGAAGC T GC TC ACCC AAGAGTGGGTGC AGGAGAAC TACC 988 

Qy 4626 TGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAA 4 684 

I I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 989 TGGAGTACCGCCAGGCGCCCGGCAGTGATCCTGTGCGCTACGAGTTCCTGTGGGGTCCAA 1048 

Qy 4685 GGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAA 4744 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I III I I II I Mill 
Db 1049 GGGCCCTTGCTGAAACCAGCTATGTGAAAGTCCTGGAGCATGTGGTCAGGGTCAATGCAA 1108 

Qy 4745 GAGT TCGC TTTTTCTTCC C ATC C C TGC G T GAAGC AGC T T T GAGAGAGGAGGAAGAGGGAG 4804 

I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I 
Db 1109 GAG T TC GC AT T T C C T AC C C ATC C C T GC AT GAAGAGG C T T T GGGAGAGGAGAAA GGAG 1165 

Qy 4805 T C T GAGC ATGAGT T GC AGC C AAGG C C AG T GG GAGGGGGAC TGGGCCAGTG 4854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I 

Db 1166 TTTGAGCAGGAGTTGCAGCTAGGGCCAGTGGGGCAGGTTGTGGGAGGGCCTGGGCCAGTG 1225 

Qy 4855 CACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTT 4914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1226 C AC GT TC C AGGGC C AC AT C C AC C AC T T T C C C T GC TC TGTTACATGAGGCCCATTCTT 1282 

Qy 4 915 CACTC T GAAGAGAGC GGT C AGT GT T C TC AG TAGT AG 4 950 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1283 C AC TCTGTGTTT GAAGAGAGC AGT C AC AGT T C T C AG TAGT GGGG AGCATG T T GGGT GT GA 1342 

Qy 4951 GTTTCTGTTCTATTGGGTGACTTGGAGATTTATC 4984 

III I I I I I I I I I II I I II I I I I I I I I I I I I 
Db 1343 GGGAACACAGTGTGGACCATCTCTCAGTTCCTGTTCTATTGGGCGATTTGGAGGTTTATC 1402 

Qy 4985 TTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCA 5044 

I I I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I I I I I I I I I I I I I I I 
Db 1403 TTTGTTTCCTTTTGGAATTGTTCCAATG-TTCCTTCTAATGGATGGTGTAATGAACTTCA 1461 

Qy 5045 GCATCCAAGTTTATGAATGACAGCAGTCACAC — AGTTCTGTGTATATAGTTTAAGGGTA 5102 

III I I I I I I I I I I I I I I I II II II I I II I I I I I I I I I I I I I III- 
Db 14 62 ACAT TC - AT T T T ATGT ATGACAGT AGAC AGAC T TAC TGCT T T TTATATAGTTT AGGAGTA 1520 

Qy 5103 AGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATA — AT 5160 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I III I 
Db 1521 AGAGT C TTGCTTTTC AT T TAT AC T GGGAAAC C C ATGT TAT T TC T TGAAT T C AGAC AC TAC 1580 

Qy 5161 AACAGCAGTGGAATAAG TAC T T AGAAATGT GAA — AAAT GAGC AG T AAAAT AG ATG A 5215 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 

Db 1581 AAGAGC AGAGGATTAAGGT TTTT T TAGAAATGTGAAACAAC ATAGCAGTAAAATAC ATGA 1640 

Qy 5216 GAT AAAG AAC T AAAGAAAT T AAGAGATAGT C AAT TC T T GC C T T A 5259 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 1641 GAT AAAG AC AT AAAGAAAT T AAAC AAT AGT T AAT T C T T GC C T T A 168 4 


RESULT 11 

BU157186 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 


FEATURES 

source 


BU157186 909 bp mRNA linear EST 04-SEP-2002 

AGENCOURT_7 941457 NIH_MGC_68 Homo sapiens cDNA clone IMAGE : 6011608 
5 ' , mRNA sequence . 
BU157186 

BU15718 6. 1 GI: 22 670718 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Euarchontoglires ; Primates; Catarrhini; 

Hominidae ; Homo . 

1 (bases 1 to 909) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 
Contact: Robert Strausberg, Ph.D. 
Email : cgapbs-r@mail.nih.gov 
Tissue Procurement: DCTD/DTP/ Gazdar 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : //image . llnl . gov 
Plate: LLAM13201 row: i column: 17 
High quality sequence start: 18 
High quality sequence stop: 583. 
Location/Qualifiers 
1. .909 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone=" IMAGE: 6011608" 
/tissue_type="large cell carcinoma" 
/lab_host="DH10B (phage-resistant ) " 
/ cl one_l ib= " NIH_MGC_6 8 " 

/note="Organ: lung; Vector: pCMV-SPORT6; Site_l: NotI; 
Site_2 : Sail; Cloned unidirectionally . Primer: Oligo dT. 
Average insert size 1.8 kb. Library constructed by Life 
Technologies . " 


ORIGIN 


Query Match 13.0%; 
Best Local Similarity 97.0%; 
Matches 765; Conservative 


Score 740.2; DB 3 
Pred. No. 2.2e-173 
0 ; Mi sma t che s 23 


Length 909; 

Indels 1; Gaps 1; 


Qy 

Db 

Qy 


3816 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 387 5 

I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I 
40 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGTTGCCCTGACGAGAG 99 

3876 TCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCC 3935 
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Db 

100 

Qy 

3936 

Db 

160 

Qy 

3996 

Db 

220 

Qy 

4056 

Db 

280 

Qy 

4116 

Db 

340 

Qy 

4176 

Db 

400 

Qy 

4236 

Db 

4 60 

Qy 

4296 

Db 

520 

Qy 

4356 

Db 

580 

Qy 

4416 

Db 

640 

Qy 

4476 

Db 

700 

Qy 

4536 

Db 

760 

Qy 

4595 

Db 

820 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCC 159 

AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGG 3995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I II II I I 

AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCGCCTCCTCCTCCTCTCCTCTGG 219 

TCC TGGGC AC C C T GGAGGAGG TGC CC AC T GC T GGGT C AAC AGAT C C T C C C C AGAGT CC T C 4055 

I I | I I I I I I I I I I I I I I It I I I I I I I I I I I I I 1 I I I I I I I I I I M I t I I I I I I I I I I I I I 

TCC TGGGC ACCCTGGAGGAGGTGCCCACTGCT GGGT CAACAGATCCTCCCCAGAGTCCTC 27 9 

AGG GAGC CTCCGCCTTTCC C AC T ACC AT C AAC T TC AC TCGAC AGAGGC AAC C C AGT GAGG 4115 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
AGGGAGC CTCCGCCTTTCC C AC TACC ATC AAC T T C AC T C AAC AGAGGC AAC C C AGT GAGG 339 

GTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC 4175 

M I I I I I I I I I I I I I I I I I M I I I II I M I I I I I I I M I I I I I M I I I I I I I I I I I I I I I 
G T T C C AG C AGC C GTGAAGAGGAGGGGC C AAGC AC C T C T T GT AT C C T GGAG TCCTTGTTCC 399 

GAG C AGT AAT C AC T AAGAAGGT GGC T GAT T TGGTT GGT TTTCTGCTCCT C AAAT AT C GAG 4235 
I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I 

GAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAG 459 
CCAGGGAGC CAGTCACAAAGGCAGAAATGC TGGAGAGTGTC ATC AAAAAT TACAAGCAC T 4295 

I I I I I I M II I I I I I I II I I I II I I I I I I I I I I I I I II I I II I I I I I I I I II I I I I I I I I 

CCAGGGAGCCAGTCACAAAGGC AG AAATGC TGGAGAGTGTCATC AAAAAT TACAAGCAC T 519 

GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 4 355 

M | | | | | [ | I II I I I I I I I I I I I I I I I I I I I I I I M I 1 I I I I I I I I I I I I I I I I I I I I I I 
GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 579 

TGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCT 4415 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGAAGGAAGC AGACC C C AC CGGC C AC TCC T AT GTC C T TGTC AC C T GC C T AGGT C T C TC C T 639 

AT GAT GGC C TGC T GG G TGAT AAT C AGAT CATGC C C AAGAC AGGC T TC C TGAT AAT T GTC C 4475 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 
ATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGGTTTCTGATAATTGGCC 699 

T GG TC AT GAT T GC AAT GGAGGGC GGCC AT GC T C C T GAGGAGGAAATC T GGGAGGAGC T GA 4 535 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
TGGTCCTGATTGCAATGGAAGGGGGCCATGCTCCTGGAGAGGAAATCTGGGACGACCTGA 7 59 

GT G TGAT GGAG GT GT AT GATGGGAGGGAGC AC AG T G - C C TAT GGGGAGCC C AGG AAGC T G 4 594 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I III Ml 
AT G T GAT GGAGG T GT ATGAT GGGAAGGAGC C C AGGGC CC TAT GGGGAG C C C C AGAAAC T G - 819 

CTCACCCAA 4 603 

III III' 
CTCCACCCA 828 


RESULT 12 

CA428506/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 


CA428506 


747 bp 


mRNA 


linear EST 07-NOV-2002 


UI-H-FEl-bez-g-10-0-UI.sl NCI_CGAP_FE1 Homo sapiens cDNA clone 


UI-H-FEl-bez-g-10-0-UI 2 
CA428506 

CA428506. 1 GI: 247 91232 
EST . 

Homo sapiens (human) 


mRNA sequence. 


http ://es/ScoreAccessWeb/GetItem . action? Appld=088 1 9669&seqld=6 1 0474&ItemName=us. . . 8/3 0/06 


ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 
REFERENCE 1 (bases 1 to 74 7) 

AUTHORS NCI-CGAP http : //www . ncbi . nlm . nih . gov/ncicgap . 

TITLE National Cancer Institute, Cancer Genome Anatomy Project (CGAP) , 

Tumor Gene Index 
JOURNAL Unpublished (1997) 
COMMENT Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 
Tissue Procurement: James Martin 
cDNA Library preparation: Dr. M. Bento Soares, University of Iowa 
cDNA Library Arrayed by: Dr. M. Bento Soares, University of Iowa 
DNA Sequencing by: Dr. M. Bento Soares, University of Iowa 
Clone Distribution: Clone distribution information can be obtained 
from Dr. M. Bento Soares, bento-soares@uiowa.edu 
Seq primer: M13 FORWARD 
POLYA=Yes . 

FEATURES Location/Qualifiers 
source 1. .747 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="UI-H-FEl-bez-g-10-0-UI" 
/tissue__type="Cell lines" 
/dev_stage="Adult" 

/lab_host="DH10B (Life Technologies)" 
/clone_lib="NCI_CGAP_FEl " 

/note="Organ: Chondrosarcoma; Vector: pT7T3-Pac 
(Pharmacia) with a modified polylinker; Site_l: EcoR I; 
Site_2: Not I; NCI_CGAP_FE1 is a normalized cDNA library 
derived from a pool of mRNA obtained from 3 cell lines 
from grade II chondrosarcoma tissues. The library was 
constructed according to Bonaldo, Lennon and Soares, 
Genome Research, 6:791-806, 1996. First strand cDNA 
synthesis was primed with an oligo-dT primer containing a 
Not I site. Double stranded cDNA was ligated to an EcoR I 
adaptor, digested with Not I, and cloned directionally 
into pT7T3-Pac vector. The oligonucleotide used to prime 
the synthesis of first-strand cDNA contains a library tag 
sequence that is located between the Not I site and the 
(dT)18 tail. The sequence tag for this library is 
CGCTACGGAC. The cell lines were provided by Dr James 
Martin from the University of Iowa. 

T AG_T I S S UE=H uma n grade 2 chondrosarcoma cell line pool 
T AG_L IB=UI-H-FE1 
TAG_SEQ=CGCTACGGAC " 

ORIGIN 

Query Match 12.7%; Score 720.2; DB 4; Length 747; 

Best Local Similarity 99.6%; Pred. No. 2.2e-168; 

Matches 722; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 4 633 CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTC 4 692 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I II I II 
Db 737 CGGCAGTGCCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTC 678 

Qy 4 693 GCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGC 4 752 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 677 GCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGC 618 


http://es/ScoreAccessWeb/GetItem.action?AppId=08819669&seqId=610474&Item 8/30/06 


Qy 4753 T T T T TC T TCCC ATC C C TGC GTGAAGC AGC T T T GAGAGAGG AGGAAGAGGGAG TC TGAGC A 4812 

I I I I I I I I I I I I I I I I I t I I I I I I It I I I I I I I I I II I I I I I I I I I I I I t I I I I I I I I I I 
Db 617 T T T T T C T TCCC ATC C C TGC GTGAAGC AGC T T T GAGAGAGG AGGAAGAGGGAG TC TGAGC A 558 

Qy 4813 TGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGT 4872 

I I I t I I I I I I I I I I I I I I I II I t II I I I I I II I I I I I I II I II I I I I II I I I I I I II I I I 
Db 557 TGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGT 4 98 

Qy 4873 C CAGC AGC T TCCCCTGCCT C GTGT GAC ATGAGGCC C AT T C T T C AC T C T GAAG AGAGCGGT 4932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I 1 I 
Db 4 97 CCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGT 4 38 

Qy 4 933 C AG TGT T C TC AGT AG TAGG TT T C T GT T C TAT T GGGT GAC T T GGAGAT T TAT CTTTGTTCT 4 992 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 437 CAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCT 378 

Qy 4 993 C T T T T GGAAT TGT TC AAAT GT t T T T T T T TAAGGGAT GGT TGAAT GAAC T TC AGC AT C C AA 5052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 377 CTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAA 318 

Qy 5053 GTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGT 5112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 317 G T T TAT GAAT GAC AGC AGT C AC AC AGT T C TGT G TAT AT AGT T T AAGGG T AAGAGT C T T GT 258 

Qy 5113 GTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAATAACAGCAGTGGA 5172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 257 GT T T TAT TCAGAT TGGGAAATCCAT TC T AT T T TGTGAAT TGGGATAAT AACAGCAGTGGA 198 

Qy 5173 ATAAGT AC T T AGAAAT GTG AAAAAT GAGC AGT AAAAT AGAT GAG AT AAAGAAC T AAAGAA 5232 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 197 ATAAGT AC T TAGAAATGTGAAAAATGAGC AGT AAAAT AGATGAG AT AAAGAAC T AAAGAA 138 

Qy 5233 AT T AAGAGAT AGT C AATT C T T GC C T TAT ACC T C AGT C TAT T C TG TAAAAT T T T T AAAGAT 52 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 137 AT T AAGAGAT AGT C AATT C TTGCC T TAT AC C T C AG T C TAT T C TG TAAAAT T T T T AAAGAT 78 

Qy 5293 AT AT GC ATAC C TGGAT T T C C T T GGC T TC T T T G AGAAT GT AAGAG AAAT T AAATC T GAAT A 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 77 ATATGC AT AC C TGGAT T TC C T T GGC TT C T T TGAGAATGT AAGAG AAAT TAAAT C T GAAT A 18 

Qy 5353 AAGAA 5357 

I I I I I 

Db 17 AAGAA 13 


RESULT 13 

DQ049942 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 


DQ049942 954 bp DNA linear GSS 02-JUN-2005 

Homo sapiens MAGEA4 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
DQ049942 

DQ04 9942. 1 GI : 66903141 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 
1 (bases 1 to 954) 

Nielsen, R., Bustamante, C . , Clark, A. G., Glanowski, S . , Sackton, T . B . , 


http://es/ScoreAccessWeb/GetItem .action? Appld=088 1 9669&seqld=6 1 0474&ItemName=us. . . 8/30/06 


TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 


TITLE 
JOURNAL 

COMMENT 


FEATURES 

source 


gene 


Hubisz, M. J. , Fledel-Alon, A. , Tanenbaum, D . M. , Civello, D. , 

White, T.J. , Sninsky, J. J. , Adams, M. D . and Cargill,M. 

A Scan for Positively Selected Genes in the Genomes of Humans and 

Chimpanzees 

(er) PLoS Biol. 3 (6), E170 (2005) 
15869325 

2 (bases 1 to 954) 

Nielsen, R., Bustamante, C . , Clark, A. G., Glanowski, S . , Sackton, T . B . , 
Hubisz, M. J. , Fledel-Alon, A. , Tanenbaum, D.M. , Civello, D. , 
White, T.J. , Sninsky, J. J., Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted (05-MAY-2005) Celera Genomics, 4 5 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. Translation starts at the beginning of 
alignment . 

Location/Qualifiers 

1. .954 

/organism= M Homo sapiens" 
/mol_type="genomic DNA" 
/db_xref="taxon:9606" 
/ chr omo s ome- " X " 
<1. .>954 
/gene="MAGEA4 " 
/locus_tag="HC17 937" 


ORIGIN 


Query Match 12.3%; 
Best Local Similarity 85.3%; 
Matches 814; Conservative 


Score 700; DB 14; 
Pred. No. 2.6e-163; 
0; Mismatches 115; 


Length 954; 


Indels 


25; Gaps 


2; 


Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


3881 AT G T C TC T TGAGC AGAGGAGTC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGCC C AAC AA 3940 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1 AT G T C T T C TGAGC AG AAGAGT C AGC AC T GC AAGC C T GAGGAAGGC GT T GAGGCC CAAGAA 60 

3941 GAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC C 397 6 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 GAGGCCCTGGGCCTGGTGGGTGCACAGGCTCCTACTACTGAGGAGCAGGAGGCTGCTGTC 120 

3977 TCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACA 4036 

I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
121 TCCTCCTCCTCTCCTCTGGTCCCTGGCACCCTGGAGGAAGTGCCTGCTGCTGAGTCAGCA 180 

4037 GAT C C T C C CC AGAGT CC TC AGGGAGC CTCCGCCTTTCC C AC T AC CATC AAC T TC AC T C GA 409 6 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 GGT C C TC C CC AGAGT C C T C AGGGAGC C T C TGC C T TAC C C AC TAC C AT C AGC T T C AC T T GC 2 40 

4097 C AG AGGC AAC C C AGT GAGGG T TCC AGC AGC C G T GAAGAGGAGGG GC C AAGC AC C T C T T GT 4156 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
TGGAGGCAACCCAATGAGGGTTCCAGCAGCCAAGAAGAGGAGGGGCCAAGCACCTCGCCT 


300 


241 

4157 ATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTT 4216 

I I I I I I I II I I I I I I I I II I III Ml I I I I I I I Ml I I I I I I I I I 
301 GAC GC AG AGT C CTTGTTCC GAG AAGC AC T C AG T AAC AAGG T GGATGAGT T GGC TC AT T T T 360 

4217 CTGCTCCT C AAAT AT C GAGC C AGGGAGC C AGT C AC AAAGGC AGAAAT GC TGG AGAG TG TC 427 6 
I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mi 
361 CTGCTCCGCAAGTATCGAGCCAAGGAGCTGGTCACAAAGGCAGAAATGCTGGAGAGAGTC 420 


Qy 4277 ATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAG 

I I I I I I I I I I I I I I I I III 1 I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II II 


4336 


http://es/ScoreAccessWeb/G^^ 8/30/06 


Db 421 ATC AAAAAT TAC AAGCGC T GC T T T C C TGTGAT C T TC GGC AAAGC C TC C GAGT C C C T GAAG 480 

Qy 4337 CTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTC 4396 

II I i I I I I I 11 I I I I I I I I I I I I I I I I I I I I I M M M I I I I I I I I I I I 
Db 481 ATGATC T T TGG C AT TGAC G TGAAGGAAGTGGAC CC C GC C AGC AAC ACC T AC AC C C T TGTC 540 

Qy 4397 ACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACA 4456 

I I I I I I I I II II I I I I II I I I I I M I I I I I II I I I I I I I I I I I I I II I I I I I I I 
Db 541 ACC T GC C T GGGC C T T T C C T ATGAT GGC C TGC T GGG T AAT AAT C AGATC T T T C C C AAGAC A 600 

Qy 44 57 GGC T TCC TGATAATTGTCC TGGTC ATGAT TGC AATGGAGGGCGGCCATGCTCCTGAGGAG 4 516 

Ml I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I II I I I I II I I 
Db 601 GGCCTTCTGATAATCGTCCTGGGCACAATTGCAATGGAGGGCGACAGCGCCTCTGAGGAG 660 

Qy 4517 GAAAT C T GGGAGGAGC T GAGTGTGATGGAGGT G TAT GAT GGGAGGGAG C AC AGTGC C TAT 4 57 6 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 661 GAAAT C T GGGAGGAGC TGGGTGTGATGGGGGTGTAT GATGGGAGGGAGCACAC TGTC TAT 720 

Qy 4577 GGGGAGC C C AGGAAG C T GC T C AC C C AAGAT T T GGT GC AGGAAAAGT AC C T GGAGTA- C GG 4 635 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I III 
Db 721 GGGGAGC CCAGGAAAC TGC TCACC C AAGAT TGGGTGC AGGAAAAC TAC C TGGAGTACCGG 780 

Qy 4636 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 4695 

I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Ml 
Db 781 CAGGTACCCGGCAGTAATCCTGCGCGCTATGAGTTCCTGTGGGGTCCAAGGGCTCTGGCT 840 

Qy 4 696 GAAAC C AGC T ATGT G AAAG TC C T T GAGT AT GT GAT C AAGG T C AG T GC AAGAG TTCGCTTT 4755 

I I I I I I I I I I I I I I I I I I I I I I I III I I I I I III I I I I I I I I I I I I I I I I I I II 
Db 841 GAAACCAGCTATGTGAAAGTCCTGGAGCATGTGGTCAGGGTCAATGCAAGAGTTCGCATT 900 

Qy 4756 T T C T T C C CAT C C C T GC GT G AAGC AGC T T T GAGAGAGGAGGAAGAGGGAGT C T GA 4 809 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GC C TAC C CATC CC T GC GTGAAGC AGC T T TGT T AGAG GAGG AAGAGGGAGT C T GA 954 


RESULT 14 

DQ034795 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 


TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 


TITLE 


DQ034795 1008 bp DNA linear GSS 02-JUN-2005 

Homo sapiens MAGEA3 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
DQ034795 

DQ034 7 95. 1 GI : 6688 6004 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires ; Primates; Catarrhini; 
Hominidae ; Homo . 

1 (bases 1 to 1008) 

Nielsen, R., Bustamante, C . , Clark, A. G., Glanowski, S . , Sackton, T . B . , 

Hubisz, M. J. , Fledel-Alon, A. , Tanenbaum, D.M. , Civello, D. , 

White, T.J. , Sninsky, J.J. , Adams, M.D. and Cargill,M. 

A Scan for Positively Selected Genes in the Genomes of Humans and 

Chimpanzees 

(er) PLoS Biol. 3 (6), E170 (2005) 
15869325 

2 (bases 1 to 1008) 

Nielsen, R., Bustamante, C . , Clark, A. G., Glanowski, S . , Sackton, T . B . , 
Hubisz, M. J. , Fledel-Alon, A. , Tanenbaum, D.M. , Civello, D. , 
White, T.J. , Sninsky, J.J. , Adams, M.D. and Cargill,M. 
Direct Submission 


http://es/ScoreAccessWeb/Gette^ 8/30/06 


JOURNAL Submitted (05-MAY-2005) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. Translation starts at the beginning of 
alignment . 

FEATURES Location/Qualifiers 
source 1. .1008 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref="taxon:9606" 

/ chr omo s ome = " X " 
gene <1. .>1008 

/gene="MAGEA3 " 

/locus_tag="HC4231" 

ORIGIN 

Query Match 12.0%; Score 678.4/ DB 14; Length 1008; 

Best Local Similarity 81.3%; Pred. No. 6.9e-158; 

Matches 820; Conservative 0; Mismatches 166; Indels 22; Gaps 2; 

CTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTC 3877 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGTGGGTCTCCATTGCCCAGCTCCTGCCCACACTCCCGCCTGTTGCCCTGACCAGAGTC 60 

AT C AT GT C TC T TGAG C AGAGGAGT C TGC AC TGC AAGC C T GAGGAAGC C C T T GAGGC C C AA 3937 
I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT C ATGC C T C T TGAGC AGAGGAGT C AGC AC T GC AAGC C T GAAGAAGGC C T T GAGGC C C GA 120 

CAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCT GCCACC 3976 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I I M M 

GGAGAGGCCCTGGGCCTGGTGGGTGCGCAGGCTCCTGCTACTGAGGAGCAGGAGGCTGCC 180 

TCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACA 4036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCTCCTCTTCTACTCTAGTTGAAGTCACCCTGGGGGAGGTGCCTGCTGCCGAGTCACCA 24 0 

GATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCGA 4096 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I III! I III 
GATCCTCCCCAGAGTCCTCAGGGAGCCTCCAGCCTCCCCACTACCATGAACTACCCTCTC 300 

C AGAGGC AAC C C AGT GAGG GT T C C AGC AGC C G T GAAGAGGAGGGGC C AAGC AC C TC T T GT 4156 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GGAGC C AAT C C T ATGAGGAC T C C AGC AAC C AAGAAGAGGAGGGGC C AAGC AC C T T C CC T 360 

AT C C T GGAGT C C T T G T T CC GAGC AG TAATC AC TAAGAAGG T GGC T GAT T TGG T TGG T T T T 4216 

I I I I I I I I I Mill I I I I I I III II I I I I I I I II II I I I I I I I I I I 
GAC C T GGAGT C T GAG T TCC AAGC AGC AC TC AG T AGGAAGG T GGC C GAG T T GG T T C AT T T T 420 

CTGCTCCT C AAAT AT C GAGC C AGGGAGC C AGT CAC AAAGGC AGAAAT G C T GG AGAG T GT C 427 6 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGCTCCTCAAGTATCGAGCCAGGGAGCCGGTCACAAAGGCAGAAATGCTGGGGAGTGTC 480 

ATC AAAAAT TACAAGCACT GTTT T CC TGAGAT C T TC GGCAAAGC C TC T GAGT CCT T GCAG 4336 

|| | | | | | I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

GTCGGAAATTGGCAGTATTTCTTTCCTGTGATCTTCAGCAAAGCTTCCAGTTCCTTGCAG 54 0 

CTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTC 4396 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
CTGGTCTTTGGCATCGAGCTGATGGAAGTGGACCCCATCGGCCACTTGTACATCTTTGCC 600 

4397 ACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACA 4456 



3818 

UD 

i 

X 

Ov 

3878 

Uk) 

D J. 

Ov 

3938 


J. Z. J. 

Ov 

vy 

3977 


181 

Qy 

4037 

Db 

241 

Qy 

4097 

Db 

301 

Qy 

4157 

Db 

361 

Qy 

4217 

Db 

421 

Qy 

4277 

Db 

481 

Qy 

4337 

Db 

541 

Qy 

4397 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


601 


I I I I 11 I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 1 I I I II 
ACCTGCCTGGGCCTCTCCTACGATGGCCTGCTGGGTGACAATCAGATCATGCCCAAGGCA 


660 


4457 GGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAG 4516 

I II I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I III I I I I II I I I 
GGCCTCCTGATAATCGTCCTGGCCATAATCGCAAGAGAGGGCGACTGTGCCCCTGAGGAG 


720 


661 

4517 GAAAT C T GGGAGGAGC T GAGTG T GAT GG AGGT GTAT GAT GGGAGGGAG C AC AGTGC C TAT 4576 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I IN I I I I I I I I I I I I I II 
721 AAAATC T GGGAGGAGC TGAGTGTGT TAGAGGT GT T T GAGGGGAGGGAAGAC AGT AT C T TG 780 

4577 GGGGAGC CC AGGAAGC TGC T C AC C C AAGAT T T GGTGC AGGAAAAGTAC C TGGAGTA- C GG 4635 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I M I I I I I I I III 
781 GGGGATCCCAAGAAGCTGCTCACCCAACATTTCGTGCAGGAAAACTACCTGGAGTACCGG 840 

4 636 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 4 695 

I I I I I M I I II I I I I I I ill I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
841 CAGGTCCCCGGCAGTGATCCTGCATGTTATGAATTCCTGTGGGGTCCAAGGGCCCTCGTT 900 


4 696 GAAAC C AGC T ATGT GAAAG TC C T T GAGT AT GT GATC AAGG T C AG T GC AAGAG TTCGCTTT 
I I I I I I I I I I II I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 GAAACCAGCTATGTGAAAGTCCTGCACCATATGGTAAAGATCAGTGGAGGACCTCACATT 

4756 T T C T T C C CAT C C C TGC GTGAAGC AGC T T T GAGAGAGGAGGAAGAGGGA 4803 
I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I II 

961 TC C TAC C C AC C CC T G C ATGAGT GGGT T T TGAGAGAG GGGGAAGAGTGA 1008 


4755 


960 


RESULT 15 

BQ224380 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 


FEATURES 

source 


BQ224380 811 bp mRNA linear EST 02-MAY-2002 

AGENCOURT_754 9013 NIH_MGC_68 Homo sapiens cDNA clone IMAGE : 6059308 
5 ' , mRNA sequence . 
BQ224380 

BQ224 380. 1 GI: 204057 80 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 

Hominidae; Homo. 

1 (bases 1 to 811) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: DCTD/DTP/Gazdar 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http : //image . llnl . gov 

Plate: LLAM13325 row: m column: 05 

High quality sequence stop: 591. 
Location/Qualifiers 
1. .811 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db xref="taxon:9606" 
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/clone=" IMAGE: 6059308" 
/tissue_type="large cell carcinoma" 
/lab_host="DH10B (phage-resistant ) " 
/clone_lib="NIH_MGC_68 " 

/note="Organ: lung; Vector: pCMV-SPORT6; Site_l: NotI; 
Site_2: Sail; Cloned unidirectionally . Primer: Oligo dT. 
Average insert size 1.8 kb. Library constructed by Life 




Technologies. " 


ORIGIN 




Query 

Match 

11.9%; Score 675.8; DB 3; Length 811; 


Best 

Local Similarity 97.4%; Pred. No. 2.9e-157; 


Matches 708; Conservative 0; Mismatches 17; Indels 2; Gaps 


Qy 

3816 

GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 

3875 


i i i i i i \ i i i i i i i i i i i i i i i i i i I I I I I I I I I I I I t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 H 1 1 H 1 I 1 1 1 1 1 1 1 1 II 1 1 11 1 1 


Db 

63 

GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGTTGCCCTGACGAGAG 

122 

Qy 

3876 

TCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCC 

3935 


i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i > i i i i i i t t i i i i i i i I t I t I I I I I l l l l l 
1 | M II 1 1 1 1 II 1 II 1 II II II 1 1 1 1 1 I II 1 M 1 1 1 1 II II 1 11 II II II 1 II II 1 1 1 1 1 


Db 

123 

T C ATC AT GTC T C T TG AGC AGAGGAGT C T GC AC T GC AAGC C T GAGGAAG C CC T TGAGGC CC 

1 ft? 

Qy 

3936 

AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGG 

3995 


i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i 1 1 

I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

183 

AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCGCCTCCTCCTCCTCTCCTCTGG 

?4? 

Qy 

3996 

TCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTC 

4055 


i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i t i i i i i i i t i i i 1 1 1 1 1 1 1 
I | | | II | M II 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

243 

TCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTC 

^0? 

Qy 

4056 

AGGGAGC CTCCGCCTTTCC C AC T AC CAT C AAC T T C AC T C GAC AGAGGC AAC C C AGT GAGG 

4115 


i i i i i i i i t i i i i i i t i i i i i i i i i i i i i i i i i i i i i t i i i i i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I | | | 1 | | II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 


Db 

303 

AGG GAGC C T CC GC C T T T C C C AC TAC CAT C AAC T T C AC TC AAC AGAGGC AAC C C AGT GAGG 


Qy 

4116 

GTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC 

4175 


i t i i i i i i i i i i i i i t i i i t i i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I | 1 | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db, 

363 

GTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC 

4 ?? 

Qy 

4176 

GAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAG 

4235 


i i i i i i i i i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I 1 I I I 1 I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 i i i i i i i i i i 


Db 

423 

GAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAG 


Qy 

4236 

C C AGGGAGC C AG TC AC AAAGGC AG AAAT GC T GGAGAGTG T C AT C AAAAAT T AC AAG C AC T 

4295 


1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 


Db 

483 

C C AGGGAGC C AGT C AC AAAGGC AG AAAT GC TGGAGAGTGT CATC AAAAAT TAC AAGC AC T 

542 

Qy 

4296 

GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 

4355 



1 I I I I I I | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 II 1 1 1 M 1 1 1 


Db 

543 

GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 

602 

Qy 

4356 

TGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCT 

4415 


1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 M 


Db 

603 

TGAAAGAAGCAGACCCCCACCGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCT 

662 

Qy 

4416 

ATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCC 

4475 


I I I I I I I 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I 1 1 1 1 1 1 1 M 1 1 1 


Db 

663 

ATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAGGACAGGCTTCCTGATAATTGTCC 

722 

Qy 

4476 

T GG T CAT - GATT GC AATGGAGGGC GGC CAT GC T C C T - GAGGAGGAAAT C T GGGAGGAGC T 

4533 



Ml Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II III 1 1 1 1 1 1 1 1 1 1 M II 


Db 

723 

T GGC CAT GGAT T GC AATGGAGGGC GGC C ATGC T C C T GGAGAAGGAAAT TC TGGAAGAAC T 

782 
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Qy 4534 GAGTGTG 4540 

I I I I I 
Db 783 GACTGGG 789 


Search completed: August 26, 2006, 01:19:37 
Job time : 24236 sees 


SCORE 1.3 BuildDate: 12/06/2005 
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8/30/06 


SCORE Search Results Details for Application 
08819669 and Search Result us-08-819-669e- 

26-rag- 


Score Home Retrieve Application SCORE System SCORE Comments / 

Page List Overview FAQ Suggestions 

This page gives you Search Results detail for the Application 08819669 and Search Result us-08- 

819-669e-26.rag. 

start 

Go Back to previous page 

GenCore version 5.1.9 
Copyright (c) 1993 - 2006 Biocceleration Ltd. 


OM protein - protein search, using sw model 


Run on: 


Title: 


August 25, 2006, 00:50:36 ; Search time 196 Seconds 

(without alignments) 
20.995 Million cell updates/sec 


US-08-819-669E-26 


Perfect score: 52 


Sequence : 


1 EADPTGHSY 9 


Scoring table: BLOSUM62 

Gapop 10.0 , Gapext 0.5 


Searched: 


2589679 seqs, 457216429 residues 


Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 


Database : 


2589679 


A_Geneseq_8 : * 

1 : geneseqpl980s : * 

2: geneseqpl 990s : * 

3: geneseqp2000s : * 

4:. geneseqp2001s : * 

5: geneseqp2002s : * 

6: geneseqp2003as : * 

7: geneseqp2003bs : * 

8 : geneseqp2004s : * 

9: geneseqp2005s : * 
10: geneseqp2006s : * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 


SUMMARIES 
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r 


Result Query 


No . 

Score 

Match 

Length 

DB 

ID 

Description 

1 

52 

100. 

0 

9 

2 

AAR29769 

Aar29769 

Antigen E 

2 

52 

100. 

0 

9 

2 

AAR63675 

Aar63675 

Synthetic 

3 

52 

100. 

0 

9 

2 

AAR50281 

Aar50281 

MAGE-1 no 

4 

52 

100. 

0 

9 

2 

AAY38303 

Aay38303 

MAGE-deri 

5 

52 

100. 

0 

9 

2 

AAR47330 

Aar47330 

HLA-A1 MA 

6 

52 

100. 

0 

9 

2 

AAR49224 

Aar49224 

HLA-A1 MA 

7 

52 

100. 

0 

9 

2 

AAR78824 

Aar78824 

MAGE-1 cy 

8 

52 

100. 

0 

9 

2 

AAR82988 

Aar82988 

P815 anti 

9 

52 

100. 

0 

9 

2 

AAR83932 

Aar83932 

MHC class 

10 

52 

100. 

0 

9 

2 

AAR65112 

Aar65112 

MAGE 1 im 

11 

52 

100 . 

0 

9 

2 

AAR65135 

Aar65135 

MAGE 1 im 

12 

52 

100. 

.0 

9 

2 

AAR75954 

Aar75954 

Melanoma 

13 

52 

100. 

0 

9 

2 

AAR99343 

Aar99343 

MAGE-1 no 

14 

52 

100. 

.0 

9 

2 

AAR90692 

Aar90692 

Human leu 

15 

52 

100. 

,0 

9 

2 

AAW00897 

Aaw00897 

Human mel 

16 

52 

100. 

,0 

9 

2 

AAW54 622 

Aaw54622 

Peptide f 

17 

52 

100. 

,0 

9 

2 

AAW78838 

Aaw78838 

MAGE-1 pr 

18 

52 

100. 

,0 

9 

2 

AAW77125 

Aaw77125 

gp75/TRP- 

19 

52 

100. 

.0 

9 

2 

AAW68 371 

Aaw68371 

H urn an MAG 

20 

52 

100. 

.0 

9 

2 

AAW75734 

Aaw75734 

Peptidase 

21 

52 

100. 

.0 

9 

2 

AAW7 5736 

Aaw75736 

Peptidase 

22 

52 

100. 

,0 

9 

2 

AAY02137 

Aay02137 

Peptide u 

23 

52 

100, 

.0 

9 

2 

AAW5 672 9 

Aaw5672 9 

MAGE-1 an 

24 

52 

100. 

.0 

9 

2 

AAW98945 

Aaw98945 

HLA-A1 bi 

25 

52 

100, 

.0 

9 

2 

AAY10424 

Aayl0424 

HLA Class 

26 

52 

100. 

. 0 

9 

2 

AAY10623 

Aayl0623 

Peptide a 

27 

52 

100. 

, 0 

9 

2 

AAY10633 

Aayl0633 

Peptide a 

28 

52 

100. 

.0 

9 

2 

AAY40228 

Aay40228 

Amino aci 

29 

52 

100. 

.0 

9 

2 

AAY45884 

Aay45884 

Immunogen 

30 

52 

100. 

.0 

9 

2 

AAY46334 

Aay46334 

Immunogen 

31 

52 

100. 

.0 

9 

2 

AAY33147 

Aay33147 

Human MAG 

32 

52 

100. 

.0 

9 

2 

AAY25177 

Aay25177 

MAGE-1 pe 

33 

52 

100. 

.0 

9 

2 

AAY23250 

Aay2 3250 

Peptide d 

34 

52 

100, 

.0 

9 

2 

AAY53541 

Aay53541 

Human MAG 

35 

52 

100, 

.0 

9 

2 

AAY26884 

Aay26884 

Tumour-de 

36 

52 

100, 

.0 

9 

2 

AAY22126 

Aay22126 

Tumour re 

37 

52 

100, 

.0 

9 

2 

AAY00685 

Aay00685 

Tumour an 

38 

52 

100, 

.0 

9 

2 

AAY49637 

Aay49637 

Tumour an 

39 

52 

100, 

.0 

9 

2 

AAY01727 

Aay01727 

Exemplary 

40 

52 

100 

.0 

9 

3 

AAY71494 

Aay71494 

Human MAG 

41 

52 

100, 

.0 

9 

3 

AAY90778 

Aay90778 

Human leu 

42 

52 

100, 

.0 

9 

3 

AAB13741 

Aabl3741 

Peptide f 

43 

52 

100 

.0 

9 

3 

AAY96509 

Aay96509 

MAGE-1 no 

44 

52 

100 

.0 

9 

3 

AAB33650 

Aab33650 

MHC class 

45 

52 

100 

.0 

9 

3 

AAB23659 

Aab23659 

Cytotoxic 


ALIGNMENTS 


RESULT 1 
AAR29769 

ID AAR29769 standard; peptide; 9 AA. 
XX 

AC AAR2 97 69; 
XX 

DT 25-MAR-2003 (revised) 
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r 


DT 

22-APR-1993 

(first entry) 

XX 



DE 

Antigen E peptide. 

XX 



KW 

Antigen; tumorigenic cell; A+ B+; T-cell; response; syngeneic; animal; 

KW 

mouse; tumour 

rejection antigen precusor; TRAP; P1A. 

XX 



OS 

Homo sapiens . 


XX 



PN 

WO9220356-A1. 


XX 



PD 

2 6-NOV-1992. 


XX 



PF 

22-MAY-1992; 

92WO-US004354 . 

XX 



PR 

23-MAY-1991; 

91US-00705702. 

PR 

09-JUL-1991; 

91US-00728838. 

PR 

23-SEP-1991; 

91US-00764364. 

PR 

12-DEC-1991; 

91US-00807043. 

XX 



PA 

(LUDW-) LUDWIG INST CANCER RES . 

XX 



PI 

Boon T, Van 

Der Bruggen P, Van Den Eynde B, Van Pel A, De Plaen E; 

PI 

Lurquin C, Chomez P, Traversari C; 

XX 



DR 

WPI; 1992-415460/50. 

XX 



PT 

Nucleic acid 

mol . encoding a human tumour rejection antigen precursor - 

PT 

useful as an 

immunostimulant in a vaccine for treating and preventing 

PT 

cancers, also 

useful in diagnosis. 

XX 



PS 

Disclosure; Page 97; 142pp; English. 

XX 



cc 

This sequence 

represents the sequence of the antigen E. Antigens such as 

cc 

this one cause a T-cell response to be elicited which transplanted into a 

cc 

syngeneic animal, usually a mouse. This antigen is derived from thecell 

cc 

line MEL3.1. 

See also AAQ32351. (Updated on 25-MAR-2003 to correct PN 

cc 

field. ) 


XX 



SQ 

Sequence 9 AA; 


Query Match 100.0%; 'Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 2 
AAR63675 

ID AAR63675 standard; protein; 9 AA. 
XX 

AC AAR63675; 
XX 

DT 25-MAR-2003 (revised) 

DT 22-JUN-1995 (first entry) 

XX 

DE Synthetic peptide derived from exon 3.1 of MAGE 1. 
XX 
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KW Melanoma antigen-1; MAGE-1; cytolytic T cells; antigen E; exon 3.1. 
XX 

OS Synthetic. 
XX 

PN WO9423031-A1. 
XX 

PD 13-OCT-1994. 
XX 

PF 17-MAR-1994; 94WO-US002 877 . 
XX 

PR 26-MAR-1993; 93US-00037230 . 
XX 

PA (LUDW-) LUDWIG INST CANCER RES. 
XX 

PI Gaugler B, Van Den Eynde B, Boon-Falleur T, Van Der Bruggen P; 
XX 

DR WPI; 1994-333192/41. 
XX 

PT New tumour rejection antigen precursor MAGE 3 - useful in treatment and 

PT diagnosis of cancer. 

XX 

PS Example 34; Page 36; 105pp; English. 
XX 

CC AAR63675 is a synthetic peptide derived from exon 3.1 of melanoma antigen 

CC -1 (MAGE-1), it was used to transfer antigen-E cytolytic T lymphocyte 

CC sensitivity to normally non-sensitive cells. (Updated on 25-MAR-2003 to 

CC correct PN field.) 
XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 
Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 

Db 1 EADPTGHSY 9 


RESULT 3 
AAR50281 

ID AAR50281 standard; protein; 9 AA. 
XX 

AC AAR50281; 
XX 

DT 25-MAR-2003 (revised) 

DT 26-SEP-1994 (first entry) 

XX 

DE MAGE-1 nonapeptide. 
XX 

KW MAGE; nonapeptide; cancer; melanoma; breast cancer; HLA; 

KW histocompatability; human leucocyte antigen; probe; treatment; therapy; 

KW vaccine. 

XX 

OS Synthetic. 
XX 

PN WO9405304-A1. 
XX 

PD 17-MAR-1994. 
XX 

PF 30-AUG-1993; 93WO-US008157 . 
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XX 

PR 31-AUG-1992 

PR 26-MAR-1993 

PR 07- JUN-1993 


92US-00938334. 
93US-00037230. 
93US-00073103. 


XX 

PA (LUDW-) LUDWIG INST CANCER RES . 
XX 

PI Boon-Falleur T, Van Der Bruggen P, De Plaen E, Lurquin C; 

PI Traversari C; 

XX 

DR WPI; 1994-100844/12. 

DR N-PSDB; AAQ44751. 
XX 

PT New nona: peptide derived from tumour rejection antigen precursor - 

PT presented by HLA-A1 cancer cells, for use in diagnosis or therapy of esp. 

PT melanoma and breast cancer. 

XX 

PS Disclosure; Page 19; 33pp; English. 
XX 

CC An isolated nonapeptide having the amino acid sequence Glu-Val-Asp- Pro- 

CC Ile-Gly-His-Leu-Tyr is derived from the tumour rejection antigen 

CC precursor encoded by the MAGE- 3 gene and presented by HLA-A1 . The 

CC nonapeptide can be used in a vaccine to treat a cancerous condition 

CC involving HLA-A1 subtype cancerous cells. The nucleic acid encoding the 

CC nonapeptide can be used as a probe to identify tumour cells. This 

CC sequence is homologous to the peptide described and is encoded by the 

CC MAGE-1 gene. (Updated on 25-MAR-2003 to correct PN field.) (Updated on 25 

CC -MAR-2003 to correct PI field.) 

XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I E I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 4 
AAY38303 

ID AAY38303 standard; peptide; 9 AA. 
XX 

AC AAY38303; 
XX 

DT 29-SEP-1999 (first entry) 
XX 

DE MAGE-derived HLA-binding peptide. 
XX 

KW Immunogen; HLA; human leukocyte antigen; binding motif; antiviral; MHC; 

KW major histocompatability complex; viral infection; anticancer; 

KW prostate cancer; lymphoma; hepatitis; AIDS; diagnostic; diagnosis. 

XX 

OS Homo sapiens . 
XX 

PN WO9403205-A1 . 
XX 

PD 17-FEB-1994. 
XX 

PF 06-AUG-1993; 93WO-US007421 . 
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XX 

PR 07-AUG-1992; 92US-00926666 . 

PR 05-MAR-1993; 93US-00027746 . 
XX 

PA (CYTE-) CYTEL CORP. 
XX 

PI Kubo RT, Grey HM, Sette A, Celis E; 
XX 

DR WPI; 1994-065403/08. 
XX 

PT Peptide which specifically binds selected MHC allele - used to induce an 

PT immune response for treatment or prevention of viral infection or cancer, 

PT or for diagnosis . 
XX 

PS Disclosure; Page 112; 150pp; English. 
XX 

CC The sequence is a specific example of a group of new immunogenic peptides 

CC having an HLA-A3.2, HLA-A1, H LA- All or HLA-A24.1 binding motif. For 

CC example, the peptides having an HLA-A3.2 binding motif each have 9-10 

CC residues and contain, from the N-terminus to the C-terminus, (a) a first 

CC conserved residue selected from L, M, I, V, S, A, T, F, C, G, D and E and 

CC (b) a second conserved residue of K, R, Y, H or F, where the first and 

CC second conserved residues are separated by 6-7 residues. The peptides are 

CC capable of binding selected MHC molecules and inducing an immune 

CC response. They can be used to treat and/or prevent viral infection and 

CC cancer, e.g. prostate cancer, lymphoma, hepatitis or AIDS. They can also 

CC be used to produce antibodies for use as diagnostic or therapeutic 

CC agents. The peptides can also be used as diagnostic agents 
XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 
Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 

Db 1 EADPTGHSY 9 


RESULT 5 
AAR47330 

ID AAR47330 standard; protein; 9 AA. 
XX 

AC AAR4 7330; 
XX 

DT 14-MAY-2003 (revised) 

DT 25-MAR-2003 (revised) 

DT 31-AUG-1994 (first entry) 
XX 

DE HLA-A1 MAGE 1 antigen peptide fragment 161-169. 
XX 

KW Immunogenic; HLA-A3.2; HLA-A1; H LA- All; binding motif; MHC molecule; 

KW immune response; viral infection; cancer; prostate cancer; lymphoma; 

KW hepatitis; AIDS; antibody; diagnosis; melanoma antigen. 
XX 

OS Synthetic . 
XX 

PN WO9403205-A1. 
XX 

PD 17-FEB-1994. 
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XX 

PF 06-AUG-1993; 93WO-US007 421 . 
XX 

PR 07-AUG-1992; 92US-00926666 . 

PR 05-MAR-1993; 93US-00027746 . 
XX 

PA (CYTE-) CYTEL CORP. 
XX 

PI Kubo RT, Grey HM, Sette A, Celis E; 
XX 

DR WPI; 1994-065403/08. 
XX 

PT Peptide which specifically binds selected MHC allele - used to induce an 

PT immune response for treatment or prevention of viral infection or cancer, 

PT or for diagnosis . 
XX 

PS Example 8; Page 52; 150pp; English. 
XX 

CC The sequences given in AAR47304-33 and AAR49201-44 are immunogenic 

CC peptides which have a HLA-A3.2, HLA-A1 or a H LA- All binding motif. These 

CC peptides may be used in the composition of the invention. These peptides 

CC are capable of binding selected MHC molecules and inducing an immune 

CC response. They can be used to treat and/or prevent viral infection and 

CC cancer, eg. prostate cancer, lymphoma, hepatitis or AIDS. They can also 

CC be used to produce antibodies for use as diagnostic or therapeutic 

CC agents. The peptides can also be used as diagnostic agents. (Updated on 

CC 25-MAR-2003 to correct PN field.) (Updated on 14-MAY-2003 to correct PS 

CC field.) 

XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 
Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 

Db 1 EADPTGHSY 9 


RESULT 6 
AAR49224 

ID AAR4 9224 standard; protein; 9 AA. 
XX 

AC AAR4 9224; 
XX 

DT 14-MAY-2003 (revised) 

DT 25-MAR-2003 (revised) 

DT 31-AUG-1994 (first entry) 
XX 

DE HLA-A1 MAGE 1 antigen peptide fragment 958.01. 
XX 

KW Immunogenic; HLA-A3.2; HLA-A1; H LA- All; binding motif; MHC molecule; 

KW immune response; viral infection; cancer; prostate cancer; lymphoma; 

KW hepatitis; AIDS; antibody; diagnosis; melanoma antigen. 
XX 

OS Synthetic. 
XX 

PN WO9403205-A1 . 
XX 

PD 17-FEB-1994. 
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XX 

PF 06-AUG-1993; 93WO-US007421 . 
XX 

PR 07-AUG-1992; 92US-00926666 . 

PR 05-MAR-1993; 93US-0002774 6 . 
XX 

PA (CYTE-) CYTEL CORP. 
XX 

PI Kubo RT, Grey HM, Sette A, Celis E; 
XX 

DR WPI; 1994-065403/08. 
XX 

PT Peptide which specifically binds selected MHC allele - used to induce an 

PT immune response for treatment or prevention of viral infection or cancer, 

PT or for diagnosis. 
XX 

PS Example 16; Page 116; 150pp; English. 
XX 

CC The sequences given in AAR47304-33 and AAR49201-44 are immunogenic 

CC peptides which have a HLA-A3.2, HLA-A1 or a H LA- All binding motif. These 

CC peptides may be used in the composition of the invention. These peptides 

CC are capable of binding selected MHC molecules and inducing an immune 

CC response. They can be used to treat and/or prevent viral infection and 

CC cancer, eg. prostate cancer, lymphoma, hepatitis or AIDS. They can also 

CC be used to produce antibodies for use as diagnostic or therapeutic 

CC agents. The peptides can also be used as diagnostic agents. (Updated on 

CC 25-MAR-2003 to correct PN field.) (Updated on 14-MAY-2003 to correct PS 

CC field.) 

XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 
Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 

Db 1 EADPTGHSY 9 


RESULT 7 

AAR78824 

ID 

AAR78824 standard; peptide; 9 AA. 

XX 


AC 

AAR78824; 

XX 


DT 

26-MAR-1996 (first entry) 

XX 


DE 

MAGE-1 cytotoxic T lymphocyte epitope. 

XX 


KW 

MAGE - 1 ; cytotoxic T; CTL; epitope; helper T; HTL; lymphocyte; cell; 

KW 

viruses; parasites; tumours; antigens; disease prevention; treatment 

XX 


OS 

Homo sapiens . 

XX 


PN 

W09522317-A1. 

XX 


PD 

24-AUG-1995. 

XX 


PF 

16-FEB-1995; 95WO-US002121 . 

XX 
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PR 16-FEB-1994; 94US-00197484 . 
XX 

PA (CYTE-) CYTEL CORP. 
XX 

PI Vitiello MA, Chesnut RW, Sette AD, Celis E, Grey H; 
XX 

DR WPI; 1995-302545/39. 
XX 

PT Compsn. inducing cytotoxic T lymphocyte response to pref. viral, 

PT bacterial, parasitic or tumour antigens - useful in the treatment and 

PT prevention of diseases associated with the antigen e.g. hepatitis B. 

XX 

PS Disclosure; Page 17; 109pp; English. 
XX 

CC A compsn. which induces a cytotoxic T lymphocyte (CTL) response to an 

CC antigen (Ag) in a mammal comprises, a CTL Ag response inducing peptide 

CC (i.e. AAR78824-R78853) and a lipid conjugated helper T cell inducing 

CC peptide. The compsn. induces a CTL response to bacterial, viral or tumour 

CC Ags, and is therefore useful in the treatment and prevention of diseases 

CC associated with the Ag 

XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 
Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 

Db 1 EADPTGHSY 9 


RESULT 8 


AAR82988 


ID 

AAR82988 standard; peptide; 9 AA. 

XX 



AC 

AAR82988; 


XX 



DT 

25-MAR-2003 

(revised) 

DT 

26-FEB-1996 

(first entry) 

XX 



DE 

P815 antigenic peptide. 

XX 



KW 

P815 antigen; 

P1A antigen; cancer; vaccine. 

XX 



OS 

Synthetic . 


XX 



PN 

W09523874-A1. 


XX 



PD 

08-SEP-1995. 


XX 



PF 

23-FEB-1995; 

95WO-US002203. 

XX 



PR 

01-MAR-1994; 

94US-00204727. 

PR 

10-MAR-1994; 

94US-00209172 . 

PR 

01-SEP-1994; 

94US-00299849. 

PR 

30-NOV-1994; 

94US-00346774 . 

XX 



PA 

(LUDW-) LUDWIG INST CANCER RES. 

XX 



PI 

De Plaen E, 

Boon-Falleur T, Lethe B, Szikora J, De Smet C; 
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PI Chomez P, Gaugler B, Van Den Eynde B, Brasseur If, Patard J; 

PI Weynants P, Marchand M, Van Der Bruggen P; 

XX 

DR WPI; 1995-320586/41. 
XX 

PT Determn. of cancerous condition(s) - using a nucleic acid as a primer to 

PT determine expression of a MAGE tumour rejection antigen precursor. 

XX 

PS Example 13; Page 22; 121pp; English. 
XX 

CC Using the sequence of the P815A antigen precursor gene P1A (AAT01176) , an 

CC antigenic peptide (AAR82988) which was A+B+ (i.e. characteristic of cells 

CC which express both A and B antigens) was produced. The peptide lysed 

CC PO.HTR cells in the presence of cytolytic T lymphocyte cell lines, and 

CC may be useful as a vaccine component. (Updated on 25-MAR-2003 to correct 

CC PI field.) 
XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

MINIMI 
Db 1 EADPTGHSY 9 


RESULT 9 

AAR83932 

ID 

AAR83932 standard; peptide; 9 AA. 

XX 


AC 

AAR83932; 

XX 


DT 

05-JUN-1996 (first entry) 

XX 


DE 

MHC class I restricted antigenic peptide #2. 

XX 


KW 

MHC class I; antigen; MAGE; melanoma; breast cancer; bladder cancer; 

KW 

Titermax; cytotoxic T-lymphocyte; tumour; pathogenic disease; bacteria; 

KW 

parasite; human; animal. 

XX 


OS 

Synthetic . 

XX 


PN 

W09528958-A1. 

XX 


PD 

02-NOV-1995 . 

XX 


PF 

21-APR-1995; 95WO-US004 975 . 

XX 


PR 

22-APR-1994; 94US-002334 96 . 

XX 


PA 

(SLOK ) SLOAN KETTERING INST CANCER RES. 

XX 


PI 

Nikolic-Zugic J, Dyall R; 

XX 


DR 

WPI; 1995-382848/49. 

XX 


PT 

Cytotoxic T-cell induction by MHC class I-restricted peptide in adjuvant 

PT 

- useful for treating tumours and bacterial or parasitic pathogenic 

PT 

diseases . 
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XX 

PS Claim 11; Page 38; 50pp; English. 
XX 

CC The sequences given in AAR83931-49 are MHC class I restricted 8-12 amino 

CC acid antigenic peptides. This peptide is derived from MAGE and is present 

CC in melanoma, breast and bladder cancer. These peptides may be 

CC administered to a subject in combination with a suitable adjuvant, pref. 

CC Titermax (RTM) , to induce cytotoxic T- lymphocytes. This method may be 

CC used in the treatment of a tumour or a pathogenic disease, esp. diseases 

CC of bacterial or parasitic origin, in humans and animals, e.g monkeys, 

CC dogs cows, horses, etc 
XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 10 


AAR65112 


ID 

AAR65112 standard; peptide; 9 AA. 


XX 



AC 

AAR65112; 


XX 



DT 

25-MAR-2003 (revised) 


DT 

06-OCT-1995 (first entry) 


XX 



DE 

MAGE 1 immunogenic peptide 161-169. 


XX 



KW 

MAGE 1; immunogenic peptide 161-169; cytotoxic C cells 


KW 

in vitro activation; cancer; AIDS; bacterial infections; malaria; 

KW 

fungal infections; tuberculosis; hepatitis. 


XX 



OS 

Homo sapiens . 


XX 



PN 

WO9504817-A1. 


XX 



PD 

16-FEB-1995. 


XX 



PF 

01-AUG-1994; 94WO-US008672 . 


XX 



PR 

06-AUG-1993; 9 3US-00103401 . 


XX 



PA 

(CYTE-) CYTEL CORP. 


XX 



PI 

Celis E, Kubo R, Serra H, Tsai V, Wentworth P; 


XX 



DR 

WPI; 1995-090895/12. 


XX 



PT 

In vitro activation of cytotoxic T cells for selected 

killing of target 

PT 

cells - for treating e.g. cancer, AIDS, hepatitis etc. 

by incubating them 

PT 

with antigen presenting cells loaded with appropriate 

immunogenic 

PT 

peptide . 


XX 



PS 

Example 3; Page 35; 53pp; English. 


XX 
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CC AAR65109-R65145 are immunogenic peptides, they are used in a new method 

CC for the in vitro activation of cytotoxic T cells (CTC). This is achieved 

CC by incubating the CTCs with antigen presenting cells loaded with an 

CC appropriate immunogenic peptide (e.g. one of the above peptides) . By 

CC selecting the peptides used the following diseases and infections can be 

CC treated; cancer, AIDS, hepatitis, other viral and bacterial infections, 

CC malaria and tuberculosis. (Updated on 25-MAR-2003 to correct PN field.) 
XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 
Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 

Db 1 EADPTGHSY 9 

RESULT 11 
AAR65135 

ID AAR65135 standard; peptide; 9 AA. 
XX 

AC AAR65135; 
XX 

DT 25-MAR-2003 (revised) 

DT 09-OCT-1995 (first entry) 

XX 

DE MAGE 1 immunogenic peptide A01. 
XX 

KW MAGE 1; immunogenic peptide A01; cytotoxic C cells; in vitro activation; 

KW cancer; AIDS; bacterial infections; malaria; fungal infections; 

KW tuberculosis ; hepatitis . 
XX 

OS Homo sapiens . 
XX 

PN WO9504817-A1. 
XX 

PD 16-FEB-1995. 
XX 

PF 01-AUG-1994; 94WO-US008 672 . 
XX 

PR 06-AUG-1993; 93US-00103401 . 
XX 

PA (CYTE-) CYTEL CORP. 
XX 

PI Celis E, Kubo R, Serra H, Tsai V, Wentworth P; 
XX 

DR WPI; 1995-090895/12. 
XX 

PT In vitro activation of cytotoxic T cells for selected killing of target 

PT cells - for treating e.g. cancer, AIDS, hepatitis etc. by incubating them 

PT with antigen presenting cells loaded with appropriate immunogenic 

PT peptide . 
XX 

PS Example 3; Page 38; 53pp; English. 
XX 

CC AAR65109-R65145 are immunogenic peptides, they are used in a new method 

CC for the in vitro activation of cytotoxic T cells (CTC) . This is achieved 

CC by incubating the CTCs with antigen presenting cells loaded with an 

CC appropriate immunogenic peptide (e.g. one of the above peptides). By 
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cc 
cc 
cc 

XX 
SQ 


selecting the peptides used the following diseases and infections can be 
treated; cancer, AIDS, hepatitis, other viral and bacterial infections, 
malaria and tuberculosis. (Updated on 25-MAR-2003 to correct PN field.) 

Sequence 9 AA; 


Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.1e+06; 
Matches 9; Conservative 0; Mismatches 0; Indels 


0 ; Gaps 


0; 


Qy 

Db 


1 EADPTGHSY 9 

I I I I I I I I I 
1 EADPTGHSY 9 


RESULT 12 

AAR7 5954 

ID 

AAR75954 standard; peptide; 9 AA. 

XX 


AC 

AAR75954; 

XX 


DT 

06-MAR-1996 (first entry) 

XX 


DE 

Melanoma antigen (MAGE-1) epitope. 

XX 


KW 

MAGE- 3; melanoma antigen; vaccine; immune response; immunogenic peptide; 

KW 

cytotoxic T lymphocyte response; CTL; melanoma; breast cancer; antibody. 

XX 


OS 

Homo sapiens . 

XX 


PN 

W09519783-A1. 

XX 


PD 

•27-JUL-1995. 

XX 


PF 

2 5-JAN-1995; 95WO-US001000 . 

XX 


PR 

2 5- JAN- 1994; 94US-0018 62 66 . 

XX 


PA 

(CYTE-) CYTEL CORP. 

XX 


PI 

Kubo RT, Grey HM, Sette A, Celis E; 

XX 


DR 

WPI; 1995-269270/35. 

XX 


PT 

Immunogenic peptide (s) that induce immune response to cancer cells - that 

PT 

express a MAGE- 3 protein peptide epitope used in vaccines or adoptive 

PT 

immuno : therapy to induce cytotoxic T lymphocytes. 

XX 


PS 

Example; Page 33; 44pp; English. 

XX 


cc 

AAR7 5954 is derived from MAGE-1 protein. It was used to show the 

cc 

specificity of CTL response to MAGE- 3 peptides shown in AAR75942-53. 

cc 

AAR7 5942 is derived from the sequence of the melanoma antigen (MAGE- 3) 

cc 

protein and can be used to elicit a primary cytotoxic T lymphocyte 

cc 

response against cells expressing MAGE- 3 . Synthetic peptides AAR75945-53 

cc 

can be used therapeutically to elicit CTL responses to melanoma, breast, 

cc 

colon, prostate, or other cells which express proteins with this epitope. 

cc 

The peptides have specific HLA-A1 binding capacity 

XX 


SQ 

Sequence 9 AA; 
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Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 

Db 1 EADPTGHSY 9 


RESULT 13 
AAR99343 

ID AAR99343 standard; protein; 9 AA. 
XX 

AC AAR99343; 
XX 

DT 22-APR-1997 (first entry) 
XX 

DE MAGE-1 nonapeptide . 
XX 

KW HLA binding peptide; cell lysis; cytolytic T cell; MAGE family; human; 

KW tumour rejection antigen precursor; TRA; MAGE-1; tumour; cancer cell; 

KW antibody; melanoma; universal effector cell; vaccine; breast cancer; CTL; 

KW therapy. 

XX 

OS Homo sapiens. 
XX 

PN W09626214-A1. 
XX 

PD 29-AUG-1996. 
XX 

PF 01-FEB-1996; 9 6WO-US00148 9 . 
XX 

PR 23-FEB-1995; 95US-00393273 . 
XX 

PA (LUDW-) LUDWIG INST CANCER RES. 
XX 

PI Boon-Falleur T, Van Der Bruggen P, De Plaen E, Lurquin C; 

PI Gaugler B, Van Den Eynde B, Traversari C, Romero P; 

XX 

DR WPI; 1996-402317/40. 

DR N-PSDB; AAT35408. 
XX 

PT New nona : peptide (s) that bind to HLA molecule (s) and induce lysis - by 

PT specific cytolytic T cells, for diagnosis and treatment of tumours and to 

PT expand T cells in vitro. 
XX 

PS Example 4; Fig 4; 41pp; English. 
XX 

CC AAR99343-R99350 represent MAGE nonapeptides , based on the tumour 

CC rejection antigen region of the full length MAGE sequences. These 

CC peptides were used to design the nonapeptides of the invention (see 

CC AAR99337-R99342) , which bind to a HLA molecule on a cell, and provoke 

CC lysis by cytolytic T cells (CTLs) specific for a complex of the HLA 

CC molecule and nonapeptide. The nonapeptides can be used diagnostically to 

CC identify tumours expressing a particular HLA molecule, or to identify 

CC cancer cells. The peptides can also be used therapeutically, to induce a 

CC CTL response to tumours (where the peptides are optionally coupled to 

CC tumour-specific antibodies), or to induce a response by CTLs that are 

CC otherwise inactive. The peptide sequences may also be used to expand 

CC specific CTLs in vitro for later return to the patient, such as for 

CC treating melanoma. Tumour cells can be identified by using DNA encoding 
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CC the nonapeptides as probes. Non-human cells transformed with the HLA-A1 

CC gene and a DNA sequence encoding one of the peptides, can be used to 

CC generate CTLs, or to detect the presence of CTLs in human samples. The 

CC non-human transformed cells, when polytransf ormed, are universal effector 

CC cells, and can be used in vaccines, or for treating melanoma or breast 

CC cancer 
XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db . 1 EADPTGHSY 9 


RESULT 14 
AAR90692 

ID AAR90692 standard; peptide; 9 AA. 
XX 

AC AAR90692; 
XX 

DT 31-JUL-1996 (first entry) 
XX 

DE Human leukocyte antigen (HLA-A1 ) presented peptide MZ2-E. 
XX 

KW Human leukocyte antigen; HLA-A1 ; MAGE-1 derived; blood mononuclear cell; 

KW BMC; CD8-beta+ cell; cytolytic T cell; CTL cell; treatment; tumour cell; 

KW diagnosis; assay; presented peptide. 
XX 

OS Synthetic. 
XX 

PN WO9535500-A1. 
XX 

PD 28-DEC-1995. 
XX 

PF 14-JUN-1995; 95WO-US007 559 . 
XX 

PR 17-JUN-1994; 94US-00261541 . 
XX 

PA (LUDW-) LUDWIG INST CANCER RES. 
XX 

PI Coulie P, Van Der Bruggen P, Boon-Falleur T; 
XX 

DR WPI; 1996-058510/06. 
XX 

PT Prodn. of specific cytolytic T cell sub-populations - by contacting blood 

PT mononuclear cells with specific peptide (s) and a population of CD8- 

PT beta(+) cells. 
XX 

PS Claim 5; Page 19; 25pp; English. 
XX 

CC The present peptide is the human leukocyte antigen (HLA-A1), MAGE-1 

CC derived presented peptide, MZ2-E. By contacting a sample of blood 

CC mononuclear cells (BMC) with the peptide (which binds directly to HLA-A1 

CC mols. on the surface of the BMC) and CD8-beta+ cells (which stimulate 

CC peptide/HLA-Al complex specific CD8-beta+ cells), a peptide/HLA-Al 

CC complex specific cytolytic T (CTL) cell subpopulation can be obtd. . The 

CC CTL cells obtd. can be administered to a patient to treat tumour cell 
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CC related conditions, and can be used in diagnostic methods, e.g. in assays 

CC for the peptide/ H LA- Al complex 

XX 

SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches .0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


9 AA. 


AAW00897; 

23-MAY-1997 (first entry) 

Human melanoma MAGE1 tumour associated antigen pl61-169. 

Adeno-associated virus; vector; liposome; transf ection; dendritic cell; 
melanoma; MAGE1; adoptive immunotherapy; tumour associated antigen. 

Homo sapiens . 

WO9703703-A1. 


RESULT 15 
AAW00897 

ID AAW00897 standard; peptide; 
XX 
AC 
XX 
DT 
XX 
DE 
XX 
KW 
KW 
XX 
OS 
XX 
PN 
XX 
PD 
XX 
PF 
XX 
PR 
PR 
PR 
XX 
PA 
XX 

PI 

XX 
DR 
XX 
PT 
PT 
PT 
XX 
PS 
XX 
CC 
CC 
CC 
CC 
CC 
CC 
CC 
CC 
CC 
XX 


06-FEB-1997 . 

19-JUL-1996; 

21-JUL-1995; 
01-NOV-1995; 
01-DEC-1995; 


96WO-US012012. 

95US-0001312P. 
95US-0007184P. 
95US-00566286. 


(RHON ) RHONE POULENC RORER PHARM INC. 
Philip R, Lebkowski JS; 
WPI; 1997-145208/13. 

Adeno-associated virus : liposome complexes for transf ecting dendritic 
cells - for inducing immune response, useful for treating e.g. neoplasia 
or infections. 

Example 5; Page 58; 134pp; English. 

Tumour associated antigens (AAW13660-61, AAW00878-903 ) can be loaded into 
dendritic cells and used to induce anti tumour immunity. Alternatively, 
the dendritic cells are transfected with adeno associated virus plasmid 
DNA (which includes DNA encoding the tumour associated antigen) complexed 
with cationic liposomes. The amtigen loaded or transfected dendritic 
cells can be used to generate tumour antigen-specific cytotoxic T 
lymphocytes for use in adoptive immunotherapy in a patient having the 
corresponding tumour. A suitable antigen comprises amino acids 161-169 
(AAW00897) of human melanoma MAGE1 
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SQ Sequence 9 AA; 

Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.1e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


Search completed: August 25, 2006, 00:54:22 
Job time : 199 sees 


SCORE 1.3 BuildDate: 12/06/2005 
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SCORE Search Results Details for Application 
08819669 and Search Result us-08-819-669e- 

26.rai. 


Score Home Retrieve Application SCORE System SCORE Comments / 

Page List Overview FAQ Suggestions 


This page gives you Search Results detail for the Application 08819669 and Search Result us-08- 
819-669e-26.rai. 


start 


Go Back to previous page 


GenCore version 5.1.9 
Copyright (c) 1993 - 2006 Biocceleration Ltd. 


OM protein - protein search, using sw model 
Run on: 


Title: 

Perfect score: 
Sequence : 


August 25, 2006, 00:59:47 ; Search time 51 Seconds 

(without alignments) 
15.447 Million cell updates/sec 

US-08-819-669E-26 
52 

1 EADPTGHSY 9 


Scoring table: BLOSUM62 

Gapop 10.0 , Gapext 0.5 


Searched: 


650591 seqs, 87530628 residues 


650591 


Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Database : Issued_Patents_AA: * 

1 : /EMC_Celerra_SIDS3/ptodata/2/iaa/5_COMB.pep:* 

2 : /EMC_Celerra_SIDS3/ptodata/2/iaa/6_COMB.pep:* 

3: /EMC_Celerra_SIDS3/ptodata/2/iaa/7_COMB.pep:* 

4 : /EMC_Celerra_SIDS3/ptodata/2/iaa/H_COMB.pep: * 

5: /EMC_Celerra_SIDS3/ptodata/2/iaa/PCTUS_COMB.pep:* 

6 : /EMC_Celerra_SIDS3/ptodata/2/iaa/RE_COMB . pep : * 

7 : /EMC_Celerra_SIDS3/ptodata/2/iaa/backfilesl .pep: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 


SUMMARIES 


% 

Result Query 

No. Score Match Length DB ID 


Description 
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Sequence 


Appli 
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Sequence 
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Appl 
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Sequence 

Z b , 

Appl 
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52 

100 
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Sequence 
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tto no oo£ o o /i i 

US- 08- 98 6-2 34 -1 

Sequence 

1/ 

Appli 
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100 
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Sequence 

9 C 

26, 

Appl 

13 

52 

100 

0 

9 

2 

tto AO i r /I /* — inn TO 

US-08-354-679C-12 

Sequence 

1 9 

12, 

Appl 

14 

52 

100 

0 
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2 

t -m /I ft i r A O O ft n ftft 
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Sequence 

99, 

Appl 

15 
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0 
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Sequence 

T 

1/ 

Appli 

16 

52 

100 

0 
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tto Aft TOO A O T OO 
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Sequence 

9 Q 

29, 

Appl 

17 

52 

100 

0 

9 

2 

tto AO OftO OTOO TO 

US-08-393-273E-12 

Sequence 

1 9 

12, 

Appl 

18 

52 

100 

0 

9 

2 

US-08-037-230D-26 

Sequence 

O £T 

Zb, 
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19 

52 

100 

0 
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2 

US- 09-18 3-706-4 

Sequence 

4, 

Appli 

20 
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0 
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Sequence 

T 

1/ 

Appli 

21 

52 

100 

0 

9 

2 

T T /"I /"\ /"\ T O ft ft O T 
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Sequence 

O 1 

21, 

Appl 
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100 
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9 

2 
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US-09-166-448-45 
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A C 

45, 

Appl 

23 

52 

100 

. 0 

9 

2 

US-09-5 67 -995-4 
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A 

4, 

Appli 

24 

52 

100 

. 0 

9 

2 

US-09-099-543C-21 

Sequence 

O T 

21, 

Appl 

25 

52 

100 

. 0 

9 

2 

Y -r /-\ i| i| o C ft ft n TO 

US- 08 -443-580 F- 12 

Sequence 

1 o 

12, 

Appl 

26 

52 

100 

. 0 

9 

2 

US-09-705-160-29 

Sequence 

29, 

Appl 

27 

52 

100 

. 0 

9 

2 

US- 09- 165 -8 63-1 

Sequence 

T 

If 

Appli 

28 

52 

100 

.0 

9 

2 

US-08-197-484-1 

Sequence 

1/ 

Appli 

29 

52 

100 

. 0 

9 

2 

US-09-697-884-45 

Sequence 

45, 

Appl 

30 

52 

100 

. 0 

9 

2 

US-09-847-185-21 

Sequence 

O 1 

21, 

Appl 

31 

52 

100 

. 0 

9 

2 

US- 08- 57 1-2 63-12 

Sequence 

1 o 

12, 

Appl 

32 

52 

100 

.0 

9 

2 

US-09- 58 3-850-26 

Sequence 

o ^ 

2b, 

Appl 

33 

52 

100 

. 0 

9 

2 

T t /— i /"\ Oftft O C ft T 

US-09-289-350-1 

Sequence 

T 

If 
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34 
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100 
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9 

2 

US-0 9- 57 4 -7 4 9B-1 
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T 

1/ 

Appli 

35 
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. 0 

9 
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US- 09- 57 9 -197 -2 6 
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2b, 
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100 
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US-09-341-982-88 

Sequence 

O O 

oo , 
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37 

52 

100 

. 0 
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US- 09- 4 04 -02 6-2 6 

Sequence 

o 

26, 

Appl 

38 

52 

100 

. 0 

9 
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T Tn rtrt A f A O/" 

US-09-312-4 64-26 

Sequence 

26, 
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52 

100 

. 0 

9 
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Trn rtrt OTft T^T 1 

US-09-318-141-1 

Sequence 

1, 
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40 

52 

100 

. 0 
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2 

tto aa 11^ nno i 

US - 09-114-002-1 

Sequence 

1, 

Appli 

41 

52 

100 

.0 
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2 

US-09-000-003A-24 

Sequence 

24, 

Appl 

42 

52 

100 

.0 

9 

2 

US-09-169-717E-7 

Sequence 

7, 

Appli 

43 

52 

100 

.0 

9 

2 

US-09-601-729-131 

Sequence 

131, App 

44 

52 

100 

.0 

9 

2 

US-09-812-528-1 

Sequence 

1, 

Appli 

45 

52 

100 

.0 

9 

2 

US-09-806-769-1 

Sequence 

1, 

Appli 


ALIGNMENTS 


RESULT 1 

US-07-938-334C-1 

; Sequence 1, Application US/07938334C 
; Patent No. 5405940 
; GENERAL INFORMATION: 

APPLICANT: Boon, Thierry; van der Bruggen, Pierre; 

APPLICANT: De Plaen, Etienne; Lurquin Christophe; Traversari, Catia 
TITLE OF INVENTION: ISOLATED NONAPEPTIDES DERIVED FROM 
TITLE OF INVENTION: MAGE GENES AND USES THEREOF 
NUMBER OF SEQUENCES : 22 
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CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 

STREET: 805 Third Avenue 

CITY: New York City 

STATE: New York 

COUNTRY : USA 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM PS/2 

OPERATING SYSTEM: PC-DOS 
; SOFTWARE: Wordperfect 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/07/938 , 334C 

FILING DATE: 31-AUG-1992 

CLASSIFICATION: 435 
ATTORNEY /AGENT INFORMATION: 

NAME: Hanson, No. 5405940man D. 

REGISTRATION NUMBER: 30,946 

REFERENCE /DOCKET NUMBER: LUD 2 93 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 9 amino acid residues 
. TYPE: amino acid 

TOPOLOGY: linear 
MOLECULE TYPE: protein 
FEATURE : 

NAME /KEY : MAGE-1 derived nonapeptide 
US-07-938-334C-1 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 2 

US-08-073-103A-12 

Sequence 12, Application US/08073103A 
Patent No. 5462871 
GENERAL INFORMATION: 

APPLICANT: Boon-Falleur , Thierry 
APPLICANT: van der Bruggen, Pierre 
APPLICANT: De Plaen, Etienne 
APPLICANT: Lurquin, Christophe 
APPLICANT: Traversari, Catia 
APPLICANT: Gaugler, Beatrice 
APPLICANT: Van den Eynde, Benoit 

TITLE OF INVENTION: ISOLATED NONAPE P T I DE S DERIVED FROM 

TITLE OF INVENTION: MAGE- 3 GENE AND PRESENTED BY HLA-A1 AND USES THEREOF 
NUMBER OF SEQUENCES: 22 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 
STREET: 805 Third Avenue 
CITY: New York City 
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STATE: New York 

COUNTRY : USA 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM PS/2 

OPERATING SYSTEM: PC-DOS 

SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/073, 103A 

FILING DATE: 7-JUNE-1993 

CLASSIFICATION: 4 35 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/938,334 

FILING DATE: 31-AUG-1992 
ATTORNEY /AGENT INFORMATION: 

NAME: Hanson, No. 54 62871man D . 

REGISTRATION NUMBER: 30,946 

REFERENCE/DOCKET NUMBER: LUD 5293.1 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
; INFORMATION FOR SEQ ID NO: 12: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 9 amino acids 

TYPE: amino acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
MOLECULE TYPE: protein 
US-08-073-103A-12 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I II 
Db 1 EADPTGHSY 9 


RESULT 3 

US-08-299-849B-26 

; Sequence 26, Application US/08299849B 

; Patent No. 5612201 

; GENERAL INFORMATION: 

APPLICANT: De Plaen, Etienne; Boon-Falleur , Thierry; 
; APPLICANT: Leth , Bernard; Szikora, Jean-Pierre; De Smet, Charles; 

APPLICANT: Chomez, Patrick 

TITLE OF INVENTION: Isolated Nucleic Acid Molecules Useful In 

TITLE OF INVENTION: Determining Expression Of A Tumor Antigen Precursor 

NUMBER OF SEQUENCES: 48 

CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 

STREET: 805 Third Avenue 

CITY: New York City 

STATE: New York 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM 

OPERATING SYSTEM: PC-DOS 
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SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08 /2 99 , 84 9B 

FILING DATE: l-SEPTEMBER-1994 

CLASSIFICATION: 4 35 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/037,230 

FILING DATE: 2 6-MARCH-1993 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: PCT/US92/04354 

FILING DATE: 22-MAY-1992 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/807,043 

FILING DATE: 12-DECEMBER-1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/764,364 

FILING DATE: 23-SEPTEMBER-1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/728,838 

APPLICATION NUMBER: 9-JULY-1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/705,702 

FILING DATE: 23-May-1991 
ATTORNEY/AGENT INFORMATION: 

NAME: Hanson, No. 5612201man D. 

REGISTRATION NUMBER: 30,946 

REFERENCE/DOCKET NUMBER: LUD 5355 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 26: 
SEQUENCE CHARACTERISTICS : 

LENGTH :. 9 amino acids 

TYPE: amino acids 

TOPOLOGY: linear 
MOLECULE TYPE: protein 
US-08-299-849B-26 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 4 
US-08-186-266-1 

Sequence 1, Application US/08186266 
Patent No. 5662907 
GENERAL INFORMATION: 


APPLICANT: 
APPLICANT: 
APPLICANT : 
APPLICANT: CELIS, 
TITLE OF INVENTION 
TITLE OF INVENTION 
TITLE OF INVENTION 
NUMBER OF SEQUENCES 


KUBO, Ralph T. 
GREY, Howard M. 
SETTE, Alessandro 
Esteban 

INDUCTION OF ANTI-TUMOR CYTOTOXIC 
T LYMPHOCYTES IN HUMANS USING 
SYNTHETIC PEPTIDE EPITOPES 
20 


CORRESPONDENCE ADDRESS : 
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ADDRESSEE: Townsend and Townsend Khourie and Crew 

STREET: Steuart Street Tower, One Market Plaza 
; CITY: San Francisco 

STATE: California 

COUNTRY : US 

ZIP: 94105-1493 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/186,266 

FILING DATE: 25-JAN-1994 

CLASSIFICATION: 424 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/159,339 

FILING DATE: 2 9-NOV-1993 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/103,396 

FILING DATE: 06-AUG-1993 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/027,746 

FILING DATE: 05-MAR-1993 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/926,666 

FILING DATE: 07-AUG-1992 
ATTORNEY /AGENT INFORMATION: 

NAME: Bastian, Kevin L. 

REGISTRATION NUMBER: 34,774 

REFERENCE /DOCKET NUMBER: 14137-50-4 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415) 543-9600 

TELEFAX: (415) 543-5043 
; INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 9 amino acids 
; TYPE: amino acid 

TOPOLOGY: linear 
MOLECULE TYPE: peptide 
US-08-186-266-1 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 5 

US-08-443-341-12 

Sequence 12, Application US/08443341 
Patent No. 5695994 
GENERAL INFORMATION: 


APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 


Boon-Falleur , Thierry 
van der Bruggen, Pierre 
De Plaen, Etienne 
Lurquin, Christophe 
Traversari, Catia 
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APPLICANT: Gaugler, Beatrice 
APPLICANT: Van den Eynde, Benoit 

TITLE OF INVENTION: ISOLATED NONAPEPTIDES DERIVED FROM 

TITLE OF INVENTION: MAGE- 3 GENE AND PRESENTED BY HLA-A1 AND USES THEREOF 
NUMBER OF SEQUENCES: 22 
CORRESPONDENCE ADDRESS : 

ADDRESSEE: Felfe & Lynch 

STREET: 805 Third Avenue 

CITY: New York City 

STATE: New York 

COUNTRY : USA 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM PS/2 

OPERATING SYSTEM: PC-DOS 
; SOFTWARE: Wordperfect 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/443,341 

FILING DATE: 17-MAY-1995 

CLASSIFICATION: 4 35 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/073,103 

FILING DATE: 7-JUNE-1993 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/938,334 

FILING DATE: 31-AUG-1992 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/037,230 

FILING DATE: 26-MARCH-1993 
ATTORNEY/AGENT INFORMATION: 

NAME: Hanson, No. 5695994man D. 

REGISTRATION NUMBER: 30,946 

REFERENCE/DOCKET NUMBER: LUD 5293.5 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 12: 
SEQUENCE CHARACTERISTICS: 
; LENGTH: 9 amino acids 

TYPE: amino acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
MOLECULE TYPE: protein 
US-08-443-341-12 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 6 

US-08-787-547-49 

; Sequence 49, Application US/08787547 
; Patent No. 5783567 
; GENERAL INFORMATION: 

APPLICANT: Hedley, Mary Lynne 
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APPLICANT: Curley, Joanne M. 
APPLICANT: Langer, Robert S. 

TITLE OF INVENTION: MICRO PARTICLES FOR DELIVERY 
TITLE OF INVENTION: OF NUCLEIC ACID 
NUMBER OF SEQUENCES: 107 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Fish & Richardson, P.C. 

STREET: 225 Franklin Street 

CITY: Boston 

STATE: MA 

COUNTRY : US 

ZIP: 02110-2804 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette 

COMPUTER: IBM Compatible 

OPERATING SYSTEM: Windows 95 

SOFTWARE: FastSEQ for Windows Version 2.0 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/787,547 

FILING DATE: 22-JAN-1997 

CLASSIFICATION: 514 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 

FILING DATE: 
ATTORNEY /AGENT INFORMATION: 
; NAME: Fraser, Janis K. 

REGISTRATION NUMBER: 34,819 

REFERENCE/DOCKET NUMBER: 08191/003001 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: 617-542-5070 

TELEFAX: 617-542-8906 

TELEX: 200154 
; INFORMATION FOR SEQ ID NO: 49: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 9 amino acids 

TYPE: amino acid 

TOPOLOGY: linear 
MOLECULE TYPE: peptide 
US-08-787-547-49 


Query Match 100 .0%; 

Best Local Similarity 100.0%; 
Matches 9; Conservative 


Score 52; DB 1; Length 9; 
Pred. No. 5e+05; 
0; Mismatches 0; Indels 


Gaps 


0; 


Qy 1 EADPTGHSY 9 

I ! I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 7 
US-08-498-461-4 

; Sequence 4, Application US/08498461 
; Patent No. 5827073 
; GENERAL INFORMATION: 

APPLICANT: Luescher, Immanuel; Anjuere, Fabienee; 

APPLICANT: Layer, Andreas; Romero, Pedro; Cerottini, Jean-Charles 
; TITLE OF INVENTION: Photoreactive Peptide Derivatives 
NUMBER OF SEQUENCES: 16 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 

STREET: 805 Third Avenue 
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CITY: New York City 

STATE: New York 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 3.5 inch, 1.44 kb storage 

COMPUTER: IBM 

OPERATING SYSTEM: PC-DOS 

SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/498,4 61 

FILING DATE: 5-JULY-1995 

CLASSIFICATION: 4 35 
ATTORNEY /AGENT INFORMATION: 

NAME: Hanson, No. 5827073man D. 

REGISTRATION NUMBER: 30,946 

REFERENCE/DOCKET NUMBER: LUD 5403 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
; INFORMATION FOR SEQ ID NO: 4: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 9 amino acids 

TYPE: amino acid 

TOPOLOGY: linear 
US-08-498-461-4 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 8 

US-08-902-516-21 

; Sequence 21, Application US/08902516 

; Patent No. 5891432 

; GENERAL INFORMATION: 

APPLICANT: Soo Hoo, William 

TITLE OF INVENTION: MEMBRANE -BOUND CYTOKINE COMPOSITIONS 

TITLE OF INVENTION: COMPRISING GM-CSF AND METHODS OF MODULATING AN IMMUNE 
TITLE OF INVENTION: RESPONSE USING SAME 
NUMBER OF SEQUENCES : 50 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: CAMPBELL & FLORES, LLP 

STREET: 4 370 La Jolla Village Drive, Suite 700 

CITY: San Diego 
; STATE: California 

COUNTRY: United States 

ZIP: 92121 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS /MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/902,516 

FILING DATE: 29-JUL-1997 

CLASSIFICATION: 424 
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ATTORNEY / AGENT INFORMATION: 
NAME: Campbell, Cathryn A. 
REGISTRATION NUMBER: 31,815 
REFERENCE/DOCKET NUMBER: P-IM 24 42 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (619)535-9001 
TELEFAX: (619)535-8949 
INFORMATION FOR SEQ ID NO: 21: 
SEQUENCE CHARACTERISTICS: 
; LENGTH: 9 amino acids 

TYPE: amino acid 
TOPOLOGY: linear 
MOLECULE TYPE: peptide 
US-08-902-516-21 


Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 9 

US-08-142-368A-26 

; Sequence 26, Application US/08142368A 

; Patent No. 5925729 

; GENERAL INFORMATION: 

APPLICANT: Boon-Falleur , Thierry; Van der Bruggen, Thierry; 
APPLICANT: Van den Eynde, Beno t; Van Pel, Aline; De Plaen, Etienne; 
; APPLICANT: Lurquin, Christophe; Chomez, Patrick; Traversari, Catia 
TITLE OF INVENTION: Tumor Rejection Antigen Precursors, Tumor 
TITLE OF INVENTION: Rejection Antigens and Uses Thereof 
NUMBER OF SEQUENCES: 2 6 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 
; STREET: 8 05 Third Avenue 

CITY: New York City 

STATE: New York 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM 

OPERATING SYSTEM: PC-DOS 

SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08 /142 , 368A 

FILING DATE: 02-MAY-1994 

CLASSIFICATION: 4 35 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: PCT/US92/04 354 

FILING DATE: 22-MAY-1992 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/807,043 

FILING DATE: 12-DECEMBER-1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/764,364 

FILING DATE: 23-SEPTEMBER-1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/728,838 
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APPLICATION NUMBER: 9-JULY-1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/705,702 
FILING DATE: 23-May-1991 
ATTORNEY/AGENT INFORMATION: 

NAME: Hanson, No. 5925729man D. 
REGISTRATION NUMBER: 30,946 
REFERENCE/ DOCKET NUMBER: LUD 5253. 4-US 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (212) 688-9200 
TELEFAX: (212) 838-3884 
; INFORMATION FOR SEQ ID NO: 26: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 9 amino acids 
; TYPE: amino acids 

TOPOLOGY: linear 
MOLECULE TYPE: protein 
US-08-142-368A-26 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 10 
US-09-036-582-1 

; Sequence 1, Application US/09036582A 

; Patent No. 5965381 

; GENERAL INFORMATION: 

; APPLICANT: van der Bruggen, Pierre 

; APPLICANT: Cornells, Guy R. 

TITLE OF INVENTION: DELIVERY OF PROTEINS INTO EUKARYOTIC CELLS 

TITLE OF INVENTION: WITH RECOMBINANT YERSINIA 

FILE REFERENCE: 11154 
; CURRENT APPLICATION NUMBER: US/09/036, 582A 

CURRENT FILING DATE: 1998-03-06 

NUMBER OF SEQ ID NOS : 39 

SOFTWARE : Patentln Ver . 2.0 
; SEQ ID NO 1 
LENGTH: 9 
TYPE : PRT 

ORGANISM: Human MAGE-1 peptide 
US-09-036-582-1 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 11 
US-08-986-234-1 

; Sequence 1, Application US/08986234 
; Patent No. 5981706 
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; GENERAL INFORMATION: 

; APPLICANT: Wallen, et al. 

TITLE OF INVENTION: Methods for Synthesizing Heat Shock Protein Complexes 
; FILE REFERENCE: UNME-0008-1 
; CURRENT APPLICATION NUMBER: US/08/986,234 
; CURRENT FILING DATE: 1997-12-05 
; NUMBER OF SEQ ID NOS : 114 
; SOFTWARE: Patentln Ver . 2.0 
; SEQ ID NO 1 

LENGTH: 9 

TYPE: PRT 

ORGANISM: human 
US-08-986-234-1 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 12 
US-08-967-727-26 

; Sequence 26, Application US/08967727 

; Patent No. 6025474 

; GENERAL INFORMATION: 

APPLICANT: Gaugler, B atrice; Van den Eynde, Beno t; 

APPLICANT: van der Bruggen, Pierre; Boon-Falleur , Thierry 

TITLE OF INVENTION: Isolated Nucleic Acid Molecules Coding For 

TITLE OF INVENTION: Tumor Rejection Antigen Precursor Mage-3 And Uses Thereof 

NUMBER OF SEQUENCES: 30 

CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 

STREET: 8 05 Third Avenue 

CITY: New York City 

STATE: New York 

ZIP : 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM 
. OPERATING SYSTEM: PC-DOS 

SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/967,727 

FILING DATE: 

CLASSIFICATION: 4 35 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/037,230 

FILING DATE: 26-MARCH-1993 

APPLICATION NUMBER: PCT/US92/04 354 

FILING DATE: 22-MAY-1992 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/807,043 

FILING DATE: 12-DECEMBER-1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/764,365 

FILING DATE: 2 3 - S E PTEMBER- 1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/728,838 
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FILING DATE: 9-JULY-1991 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/705,702 
FILING DATE: 23-MAY-1991 
ATTORNEY /AGENT INFORMATION: 

NAME: Hanson, No. 6025474man D. 
REGISTRATION NUMBER: 30,946 
REFERENCE/DOCKET NUMBER: LUD 5353 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (212) 688-9200 
TELEFAX: (212) 838-3884 
; INFORMATION FOR SEQ ID NO: 26: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 9 amino acids 

; TYPE: amino acids 

TOPOLOGY: linear 
MOLECULE TYPE: protein 
US-08-967-727-26 


Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

MINIMI 
Db 1 EADPTGHSY 9 


RESULT 13 
US-08-354-679C-12 

; Sequence 12, Application US/08354679C 

; Patent No. 6034214 

; GENERAL INFORMATION: 

APPLICANT: Boon, Thierry; van der Bruggen, Pierre; 
; APPLICANT: De Plaen, Etienne; Lurquin Christophe; Traversari, Catia 
TITLE OF INVENTION: ISOLATED NONAPE P T I DE S DERIVED FROM 
TITLE OF INVENTION: MAGE GENES AND USES THEREOF 
NUMBER OF SEQUENCES: 2 5 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 
; STREET: 805 Third Avenue 

CITY: New York City 

STATE: New York 

COUNTRY : USA 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 3.5 inch, 1.44 mb storage 

COMPUTER: IBM PS/2 

OPERATING SYSTEM: PC-DOS 
; SOFTWARE: Wordperfect 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/354, 679C 

FILING DATE: 13-DECEMBER-1994 

CLASSIFICATION: 530 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/938,334 

FILING DATE: 31-AUGUST-1992 
ATTORNEY /AGENT INFORMATION: 

NAME: BAER, MADELINE F. 

REGISTRATION NUMBER: 36,437 

REFERENCE/DOCKET NUMBER: LUD 5293.2 
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TELECOMMUNICATION INFORMATION: 
TELEPHONE: (212) 688-9200 
TELEFAX: (212) 838-3884 
; INFORMATION FOR SEQ ID NO: 12: 
SEQUENCE CHARACTERISTICS : 
LENGTH: 9 amino acids 
; TYPE: amino acid 

STRANDEDNESS: single 
TOPOLOGY: linear 
MOLECULE TYPE: protein 
US-08-354-679C-12 


Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 14 
US-08-159-339A-99 

; Sequence 99, Application US/08159339A 
; Patent No. 6037135 
; GENERAL INFORMATION: 

APPLICANT: Kubo, Ralph T. 

APPLICANT: Grey, Howard M. 
; APPLICANT: Sette, Alessandro 

APPLICANT: Celis, Esteban 

TITLE OF INVENTION: HLA Binding peptides and Their 
TITLE OF INVENTION: Uses 
NUMBER OF SEQUENCES: 12 54 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Townsend and Townsend and Crew LLP 

STREET: Two Embarcadero Center, Eighth Floor 

CITY: San Francisco 

STATE: CA 

COUNTRY : USA 

ZIP: 94111-3834 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette 

COMPUTER: IBM Compatible 

OPERATING SYSTEM: DOS 

SOFTWARE: FastSEQ for Windows Version 2.0 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/159, 339A 

FILING DATE: 29-NOV-1993 

CLASSIFICATION: 424 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/926,666 

FILING DATE: 07-AUG-1992 

APPLICATION NUMBER: US 08/027,746 

FILING DATE: 05-MAR-1993 

APPLICATION NUMBER: US 08/103,396 

FILING DATE: 06-AUG-1993 
ATTORNEY /AGENT INFORMATION: 

NAME: Weber, Ellen Lauver 

REGISTRATION NUMBER: 32,7 62 

REFERENCE/DOCKET NUMBER: 018623-005030US 
TELECOMMUNICATION INFORMATION: 
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TELEPHONE: (415) 576-0200 
TELEFAX: (415) 576-0300 
TELEX: 

INFORMATION FOR SEQ ID NO: 99: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 9 amino acids 
; TYPE: amino acid 

STRANDEDNESS : single 
TOPOLOGY: linear 
MOLECULE TYPE: peptide 
US-08-159-339A-99 


Query Match 100.0%; 
Best Local Similarity 100.0%; 
Matches 9; Conservative 


Score 52; DB 2; Length 9; 
Pred. No. 5e+05; 
0; Mismatches 0; Indels 


0; Gaps 


0; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 15 
US-08-795-733B-1 

; Sequence 1, Application US/08795733B 
; Patent No. 6087441 
; GENERAL INFORMATION: 

; APPLICANT: Ayyoub, Maha; Monsarrat, Bernard; Mazarg 

APPLICANT: Honor ; Van Der Eynde, Beno t; Gairin, Jean 
APPLICANT: Edouard 

TITLE OF INVENTION: Structurally Modified Peptides 
TITLE OF INVENTION: Resistant to Peptidase Degradation 
NUMBER OF SEQUENCES: 15 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Fulbright & Jaworski L.L.P. 

STREET: 666 Fifth Avenue 

CITY: New York 

STATE: New York 

COUNTRY : USA 

ZIP : 10103 
COMPUTER READABLE FORM: 

MEDIUM TYPE: 3.5 inch 1.4 4 Mb storage diskette 

COMPUTER: IBM PS/2 

OPERATING SYSTEM: PC-DOS 

SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/795, 733B 

FILING DATE: February 13, 1997 

CLASSIFICATION: 
ATTORNEY /AGENT INFORMATION: 

NAME: No. 6087441man D. Hanson 

REGISTRATION NUMBER: 30,946 

REFERENCE/DOCKET NUMBER: LUD 5461 - JEL/NDH 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 9 amino acids 

TYPE: amino acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
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MOLECULE TYPE: protein 
US-08-795-733B-1 


Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 5e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


Search completed: August 25, 2006, 01:01:08 
Job time : 53 sees 


SCORE 1.3 BuildDate: 12/06/2005 
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SCORE Search Results Details for Application 
08819669 and Search Result us-08-819-669e- 
26-rapbm, 

Score Home Retrieve Application SCORE System SCORE Comments / 

Page List Overview FAQ Suggestions 

This page gives you Search Results detail for the Application 08819669 and Search Result us-08- 

819-669e-26.rapbm. 

start 

Go Back to previous page 

GenCore version 5.1.9 
Copyright (c) 1993 - 2006 Biocceleration Ltd. 


OM protein - protein search, using sw model 


Run on: August 25, 2006, 01:11:39 ; Search time 184 Seconds 

(without alignments) 
22.657 Million cell updates/sec 

Title: US-08-819-669E-26 

Perfect score: 52 

Sequence: 1 EADPTGHSY 9 


Scoring table: BLOSUM62 

Gapop 10.0 , Gapext 0.5 

Searched: 2097797 seqs, 463214858 residues 

Total number of hits satisfying chosen parameters: 2097797 


Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 


Database 


Publ i s he d_Appl i c a t ion s_AA_Ma i n : * 

1 : /EMC_Celerra_SIDS3/ptodata/2/pubpaa/US07_PUBCOMB.pep: * 

2 : /EMC_Celerra_SIDS3/ptodata/2/pubpaa/US08_PUBCOMB.pep:* 

3 : /EMC_Celerra_SIDS3/ptodata/2/pubpaa/US09_PUBCOMB.pep:* 

4 : /EMC_Celerra_SIDS3/ptodata/2/pubpaa/US10A_PUBCOMB.pep: * 

5 : /EMC_Celerra_SIDS3/ptodata/2/pubpaa/US10B_PUBCOMB.pep: * 

6: /EMC_Celerra_SIDS3/ptodata/2/piibpaa/USll_PUBCOMB.pep:* 


Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 


Result Query 

No. Score Match Length DB ID 


Description 
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ALIGNMENTS 


RESULT 1 

US-08-344-824-18 

; Sequence 18, Application US/08344824 
; Publication No. US20030152580A1 
; GENERAL INFORMATION: 

APPLICANT: SETTE, Alessandro 

APPLICANT : SIDNEY, John 

TITLE OF INVENTION: HLA BINDING PEPTIDES AND THEIR USES 
NUMBER OF SEQUENCES: 39 9 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Townsend and Townsend Khourie and Crew 
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STREET: One Market Plaza, Steuart Street Tower, 20th 

STREET: Floor 

CITY: San Francisco 

STATE: California 

COUNTRY : USA 

ZIP : 94105 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS /MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/344,824 

FILING DATE: 23-NOV-1994 

CLASSIFICATION: 514 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/278,634 

FILING DATE: 21-JUL-1994 
ATTORNEY /AGENT INFORMATION: 

NAME: Bastian, Kevin L. 

REGISTRATION NUMBER: 34,774 

REFERENCE/DOCKET NUMBER: 14137-80-1 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415) 543-9600 

TELEFAX: (415) 543-5043 
; ' INFORMATION FOR SEQ ID NO: 18: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 9 amino acids 

TYPE: amino acid 

STRANDEDNESS : single 

TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
US-08-344-824-18 

Query Match 100.0%; Score 52; DB 2; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 2 
US-09-812-528-1 

; Sequence 1, Application US/09812528 
; Patent No. US20010018210A1 
; GENERAL INFORMATION: 

APPLICANT: Bachovchin, William 
; APPLICANT: Wallner, Barbara 

; TITLE OF INVENTION: STIMULATION OF HEMATOPOIETIC CELLS IN 
; TITLE OF INVENTION: VITRO 
; FILE REFERENCE: 10248/7015 

; CURRENT APPLICATION NUMBER: US/09/812,528 

; CURRENT FILING DATE: 2001-03-20 

; PRIOR APPLICATION NUMBER: US 60/060,306 

; PRIOR FILING DATE: 1997-09-29 

; PRIOR APPLICATION NUMBER: US 09/162,934 

; PRIOR FILING DATE: 1998-09-29 

; NUMBER OF SEQ ID NOS : 20 

SOFTWARE: FastSEQ for Windows Version 3.0 
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; SEQ ID NO 1 

LENGTH : 9 

TYPE : PRT 
; ORGANISM: homo sapiens 
US-09-812-528-1 

Query Match 100.0%; Score 52; DB 3; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 3 

US-09-847-185-21 

; Sequence 21, Application US/09847185 
; Patent No. US20020076392A1 
GENERAL INFORMATION: 

APPLICANT: Soo Hoo, William 

TITLE OF INVENTION: MEMBRANE -BOUND CYTOKINE COMPOSITIONS 

COMPRISING GM-CSF AND METHODS OF MODULATING AN IMMUNE 
RESPONSE USING SAME 
NUMBER OF SEQUENCES: 50 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: CAMPBELL & FLORES, LLP 

STREET: 4370 La Jolla Village Drive, Suite 700 

CITY: San Diego 

STATE: California 

COUNTRY: United States 

ZIP : 92121 
COMPUTER READABLE FORM: 
; MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/0 9/84 7,18 5 

FILING DATE: Ol-May-2001 

CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 09/201,931 

FILING DATE: 
ATTORNEY /AGENT INFORMATION: 
; NAME: Campbell, Cathryn A. 

REGISTRATION NUMBER: 31,815 

REFERENCE/DOCKET NUMBER: P-IM 2442 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (619)535-9001 

TELEFAX: (619)535-8 94 9 
INFORMATION FOR SEQ ID NO: 21: 
SEQUENCE CHARACTERISTICS : 
; LENGTH: 9 amino acids 

TYPE: amino acid 

TOPOLOGY: linear 
MOLECULE TYPE: peptide 
SEQUENCE DESCRIPTION: SEQ ID NO: 21: 
US-09-847-185-21 

Query Match 100.0%; Score 52; DB 3; Length 9; 
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Best Local Similarity 100.0%; Pred. No. 1.9e+06; 
Matches 9; Conservative 0; Mismatches 0; Indels 


0 ; Gaps 0 ; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 4 
US-09-077-214-9 

Sequence 9, Application US/09077214 
Publication No. US20020085997A1 
GENERAL INFORMATION: 

APPLICANT : Schmidt, Walter 
APPLICANT: Birnstiel, Max 
APPLICANT: Schweighof f er , Tamas 
APPLICANT: Steinlein, Peter 
APPLICANT : Buschle, Michael 

TITLE OF INVENTION: Tumor Vaccine And Process For the 
TITLE OF INVENTION: Preparation Thereof 
NUMBER OF SEQUENCES: 33 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Sterne, Kessler, Goldstein & Fox P.L.L.C. 
STREET: 1100 New York Avenue N.W. 
CITY: Washington 
STATE : D . C . 
COUNTRY: U.S.A. 
ZIP: 20005 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/077,214 

FILING DATE: * 
CLASSIFICATION: 424 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: DE 195 4 3 649 ."0 
FILING DATE: 23-NOV-1995 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: DE 196 07 044.9 
FILING DATE: 24-FEB-1996 
ATTORNEY /AGENT INFORMATION :- 
NAME: Fleshner, Raz E. 
REGISTRATION NUMBER: 34,331 
REFERENCE/DOCKET NUMBER: 0652.1710000 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 202-371-2600 
TELEFAX: 202-371-2540 
INFORMATION FOR SEQ ID NO: 9: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 9 amino acids 
TYPE: amino acid 
STRANDEDNESS : single 
TOPOLOGY: not relevant 
MOLECULE TYPE: peptide 
US-09-077-214-9 

Query Match 100.0%; Score 52; DB 3; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 
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Matches 


9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I E I I I I 
Db 1 EADPTGHSY 9 


RESULT 5 
US-09-923-831-4 

; Sequence 4, Application US/09923831 

; Patent No. US20020115142A1 

; GENERAL INFORMATION: 

; APPLICANT: Martelange, Val,rie 

; APPLICANT: De Smet, Charles 

APPLICANT: Boon- Falleur , Thierry 

TITLE OF INVENTION: TUMOR ASSOCIATED NUCLEIC ACIDS AND USES THEREFOR 

FILE REFERENCE: L0 461/ 7 054 
; CURRENT APPLICATION NUMBER: US/09/923,831 
; CURRENT FILING DATE: 2001-08-07 
; PRIOR APPLICATION NUMBER: 09/183,706 
; PRIOR FILING DATE: 2001-10-30 
; NUMBER OF SEQ ID NOS : 43 
; SEQ ID NO 4 
LENGTH: 9 
TYPE: PRT 
; ORGANISM: Homo sapiens 
US-09-923-831-4 

Query Match 100.0%; Score 52; DB 3; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 6 

US-09-888-721-23 

Sequence 23, Application US/09888721 
Patent No. US20020132990A1 
GENERAL INFORMATION: 
APPLICANT: Huston, James S. 
APPLICANT: Wils, Pierre 
APPLICANT: Zhu, Quan 
APPLICANT: Laurent, Olivier 
APPLICANT: Marasco, Wayne A. 
APPLICANT: Scherman, Daniel 

TITLE OF INVENTION: BIOENGINEERED VEHICLES FOR TARGETED NUCLEIC ACID 
TITLE OF INVENTION: DELIVERY 
FILE REFERENCE: 23611-A USA 
CURRENT APPLICATION NUMBER: US/09/888,721 
CURRENT FILING DATE: 2001-06-25 
PRIOR APPLICATION NUMBER: 60/213,653 
PRIOR FILING DATE: 2000-06-23 
NUMBER OF SEQ ID NOS: 4 5 
SOFTWARE: Patentln Ver . 2.0 
SEQ ID NO 2 3 
LENGTH: 9 
TYPE: PRT 

ORGANISM: Homo sapiens 
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US-09-888-721-23 

Query Match 100.0%; Score 52; DB 3; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 7 

US-09-766-889A-8 

Sequence 8, Application US/09766889A 
Patent No. US20020164654A1 
GENERAL INFORMATION: 
APPLICANT: Luiten, Rosalie 
APPLICANT: Boon-Falleur , Thierry 
APPLICANT: van der Bruggen, Pierre 
APPLICANT: Stroobant, Vincent 
APPLICANT: Demotte, Nathalie 
APPLICANT: Schultz, Erwin 

TITLE OF INVENTION: MAGE ANTIGENIC PEPTIDES WHICH BIND HLA-B35 AND HLA-B4 4 
FILE REFERENCE: L0461/7104 

CURRENT APPLICATION NUMBER: US/09/7 66, 889A 
CURRENT FILING DATE: 2001-01-19 
PRIOR APPLICATION NUMBER: US 60/177,242 
PRIOR FILING DATE: 2000-01-20 
PRIOR APPLICATION NUMBER: US 60/243,212 
PRIOR FILING DATE: 2000-10-25 
NUMBER OF SEQ ID NOS : 59 

SOFTWARE: FastSEQ for Windows Version 3.0 
SEQ ID NO 8 
LENGTH: 9 
TYPE: PRT 

ORGANISM: Homo sapiens 
US-09-766-889A-8 

Query Match 100.0%; Score 52; DB 3; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 8 

US-09-909-460-49 

; Sequence 49, Application US/09909460 

; Publication No. US20020182258A1 

; GENERAL INFORMATION: 

; APPLICANT: Lunsford, Lynn B. 

APPLICANT: Putnam, David 
; APPLICANT: Hedley, Mary Lynn 

; TITLE OF INVENTION: MICRO PARTICLES FOR DELIVERY OF NUCLEIC 
; TITLE OF INVENTION: ACID 

FILE REFERENCE: 08191/014001 
; CURRENT APPLICATION NUMBER: US/09/909,4 60 
; CURRENT FILING DATE: 2001-07-18 

; PRIOR APPLICATION NUMBER: EARLIER APPLICATION NUMBER: US/09/321,346 
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; PRIOR FILING DATE: EARLIER FILING DATE: 1999-05-27 
; NUMBER OF SEQ ID NOS : 114 

SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 4 9 

LENGTH: 9 

TYPE: PRT 

ORGANISM: Homo sapiens 
US-09-909-460-49 

Query Match 100.0%; Score 52; DB 3; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 9 

US-09-789-649-21 

; Sequence 21, Application US/09789649 

; Publication No. US20030082804A1 

; GENERAL INFORMATION: 

; APPLICANT: Valmori, Danila 

APPLICANT: Cerottini, Jean-Charles 
; APPLICANT: Romero, Pedro 

; TITLE OF INVENTION: Isolated No. US20030082 804Ala - And Decapeptides Which Bind 
; TITLE OF INVENTION: To HLA Molecules, and the Use Thereof 
; FILE REFERENCE: LUD 54 83.2 

; CURRENT APPLICATION NUMBER: US/09/7 89,64 9 

; CURRENT FILING DATE: 2001-02-21 

; PRIOR APPLICATION NUMBER: US09/099, 543 

; PRIOR FILING DATE: 1998-06-18 

; PRIOR APPLICATION NUMBER: US 09/061,388 

; PRIOR FILING DATE: 1998-04-16 

; PRIOR APPLICATION NUMBER: US 08/880,963 

; PRIOR FILING DATE: 1997-06-23 

; NUMBER OF SEQ ID NOS: 32 

; SEQ ID NO 21 

LENGTH : 9 

TYPE: PRT 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Peptide from MAGE-1 Protein 
US-09-789-649-21 

Query Match 100.0%; Score 52; DB 3; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I II I I E I I 
Db 1 EADPTGHSY 9 


RESULT 10 
US-09-872-836-49 

; Sequence 49, Application US/09872836 

; Publication No. US20040142475A1 

; GENERAL INFORMATION: 

; APPLICANT: Barman, Shikha P. 
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; APPLICANT: McKeever, Una 

APPLICANT: Hedley, Mary Lynne 
; TITLE OF INVENTION: DELIVERY SYSTEMS FOR BIOACTIVE AGENTS 
; FILE REFERENCE: 08191-018001 
; CURRENT APPLICATION NUMBER: US/09/872,836 
; CURRENT FILING DATE: 2001-06-01 
; PRIOR APPLICATION NUMBER: US 60/208,830 
; PRIOR FILING DATE: 2000-06-02 
; NUMBER OF SEQ ID NOS : 120 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 4 9 
LENGTH: 9 
TYPE : PRT 

ORGANISM: Homo sapiens 
US-09-872-836-49 

Query Match 100.0%; Score 52; DB 3; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 11 
US-10-161-097-1 

; Sequence 1, Application US/10161097 

; Publication No. US200300964 04A1 

; GENERAL INFORMATION: 

; APPLICANT: ROSENZWEIG, Michael 

; APPLICANT: PYKETT , Mark J. 

; APPLICANT: SCADDEN, David T. 

; APPLICANT: POZNANSKY, Mark C. 

; TITLE OF INVENTION: LYMPHOID TISSUE-SPECIFIC CELL PRODUCTION 

; TITLE OF INVENTION: FROM HEMATOPOIETIC PROGENITOR CELLS IN THREE-DIMENSIONAL 

; TITLE OF INVENTION: DEVICES 

; FILE REFERENCE: C1005/7012 /KA/ERG 

; CURRENT APPLICATION NUMBER: US/10/161,097 

; CURRENT FILING DATE: 2002-05-31 

; PRIOR APPLICATION NUMBER: US/0 9/574,74 9 

; PRIOR FILING DATE: 2002-05-31 

; PRIOR APPLICATION NUMBER: US 60/107,972 

; PRIOR FILING DATE: 1998-11-12 

; PRIOR APPLICATION NUMBER: PCT/US99/2 67 95 

; PRIOR FILING DATE: 1999-11-12 

; PRIOR APPLICATION NUMBER: US 09/524,749 

; PRIOR FILING DATE: 2000-05-18 

; NUMBER OF SEQ ID NOS: 58 

; SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 1 

LENGTH: 9 

TYPE: PRT 
; ORGANISM: Artificial Sequence 

FEATURE : 

OTHER INFORMATION: Homo Sapiens source 
US-10-161-097-1 

Query Match 100.0%; Score 52; DB 4; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
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Qy 

Db 


1 EADPTGHSY 9 

I II I I I I I I 
1 EADPTGHSY 9 


RESULT 12 
US-10-128-711-1 

; Sequence 1, Application US/10128711 
; Publication No. US20030099634A1 
GENERAL INFORMATION: 

APPLICANT: VITIELLO, Maria A. 

CHESTNUT, Robert W. 
SETTE, Alessandro D. 
CELIS,. Esteban 
GRAY, Howard 

TITLE OF INVENTION: COMPOSITIONS AND METHODS FOR ELICITING 

CTL IMMUNITY 
NUMBER OF SEQUENCES: 153 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Townsend and Townsend Khourie and Crew 
; STREET: Steuart Street Tower, One Market Plaza 

CITY: San Francisco 

STATE: California 

COUNTRY: US 

ZIP : 94105-1493 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/10/128,711 

FILING DATE: 22-Apr-2002 

CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/08/197,484 

FILING DATE: 16-FEB-1994 

APPLICATION NUMBER: US 07/935,811 

FILING DATE: 2 6-AUG-1992 

APPLICATION NUMBER: US 07/874,4 91 

FILING DATE: 27-APR-1992 

APPLICATION NUMBER: US 07/827,682 

FILING DATE: 29-JAN-1992 

APPLICATION NUMBER: US 07/749,568 

FILING DATE: 26-AUG-1991 
ATTORNEY /AGENT INFORMATION: 
; NAME: Parmelee, Steven W. 

REGISTRATION NUMBER: 31,990 

REFERENCE/DOCKET NUMBER: 14137-26-4 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (206) 467-9600 

TELEFAX: (206) 623-6793 
INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 9 amino acids 
; TYPE: amino acid 

; STRANDEDNESS : unknown 

; TOPOLOGY : unknown 

MOLECULE TYPE: peptide 
SEQUENCE DESCRIPTION: SEQ ID NO: 1: 
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US-10-128-711-1 


Query Match 100.0%; Score 52; DB 4; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I II I 
Db 1 EADPTGHSY 9 


RESULT 13 
US-10-224-286-21 

; Sequence 21, Application US/10224286 
; Publication No. US20030108517A1 
GENERAL INFORMATION: 

APPLICANT: Soo Hoo, William 

TITLE OF INVENTION: MEMBRANE -BOUND CYTOKINE COMPOSITIONS 

COMPRISING GM-CSF AND METHODS OF MODULATING AN IMMUNE 
RESPONSE USING SAME 
NUMBER OF SEQUENCES: 50 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: CAMPBELL & FLORES, LLP 

STREET: 4370 La Jolla Village Drive, Suite 700 

CITY: San Diego 
; STATE: California 

COUNTRY: United States 

ZIP: 92121 
COMPUTER READABLE FORM: 
; MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/10/224,286 

FILING DATE: 19-Aug-2002 

CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/08/902,516 

FILING DATE: 29-JUL-1997 
ATTORNEY /AGENT INFORMATION: 

NAME: Campbell, Cathryn A. 

REGISTRATION NUMBER: 31,815 

REFERENCE /DOCKET NUMBER: P-IM 2442 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (619)535-9001 

TELEFAX: (619)535-8 94 9 
INFORMATION FOR SEQ ID NO: 21: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 9 amino acids 
; TYPE: amino acid 

TOPOLOGY: linear 
MOLECULE TYPE: peptide 
SEQUENCE DESCRIPTION: SEQ ID NO: 21: 
US-10-224-286-21 

Query Match 100.0%; Score 52; DB 4; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
Qy 1 EADPTGHSY 9 
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1 1 1 1 1 1 1 1 1 

Db 1 EADPTGHSY 9 


RESULT 14 
US-10-170-832-45 

Sequence 45, Application US/10170832 
Publication No. US20030170792A1 
GENERAL INFORMATION: 
APPLICANT: Chaux, Pascal 
APPLICANT: Vantomme, Valrie 
APPLICANT: Stroobant, Vincent 
APPLICANT: Boon-Falleur , Thierry 
APPLICANT: van der Bruggen, Pierre 
APPLICANT: Thielemans , Kris 
APPLICANT: Corthals, Jurgen 

TITLE OF INVENTION: MAGE- 3 PEPTIDES PRESENTED BY HLA CLASS II MOLECULES 
FILE REFERENCE: L0461/7052 

CURRENT APPLICATION NUMBER: US/10/170,832 
CURRENT FILING DATE: 2002-06-12 
PRIOR APPLICATION NUMBER: US/09/166,448 
PRIOR FILING DATE: 1998-10-05 
NUMBER OF SEQ ID NOS : 81 

SOFTWARE: FastSEQ for Windows Version 3.0 
SEQ ID NO 4 5 
LENGTH : 9 
TYPE: PRT 

ORGANISM: Homo sapiens 
US-10-170-832-45 


Query Match 100.0%; Score 52; DB 4; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 
Matches 9; Conservative 0; Mismatches 0; Indels 


Gaps 


Qy 

Db 


1 EADPTGHSY 9 

I I I I I I I I I 
1 EADPTGHSY 9 


RESULT 15 
US-10-239-313A-2 

; Sequence 2, Application US/10239313A 
; Publication No. US20030175285A1 
; GENERAL INFORMATION: 

; APPLICANT: KLINGUER - HAMOUR, Christine 

; APPLICANT : CORVAIA, Nathalie 

; APPLICANT: BECK, Alain 

; APPLICANT: GOETSCH, Liliane 

TITLE OF INVENTION: MOLECULE OF PHARMACEUTICAL INTEREST COMPRISING AT ITS 
; TITLE OF INVENTION: N-TERMINAL A GLUTAMIC ACID OR A GLUTAMINE IN THE FORM 
; TITLE OF INVENTION: OF A PHYSIOLOGICALLY ACCEPTABLE STRONG ACID 
; FILE REFERENCE: 34 3 72 7 - US 

; CURRENT APPLICATION NUMBER: US/10/2 39 , 313A 
; CURRENT FILING DATE: 2002-09-19 

PRIOR APPLICATION NUMBER: FR 00/03711 
; PRIOR FILING DATE: 2000-03-23 

PRIOR APPLICATION NUMBER: PCT 01/70772 
; PRIOR FILING DATE: 2001-03-22 
; NUMBER OF SEQ ID NOS: 697 
; SOFTWARE: Patentln Ver . 2.1 
; SEQ ID NO 2 


http://es/ScoreAccessWeb^ 8/30/06 


LENGTH: 9 
TYPE: PRT 

ORGANISM: Homo sapiens 
US-10-239-313A-2 

Query Match 100.0%; Score 52; DB 4; Length 9; 

Best Local Similarity 100.0%; Pred. No. 1.9e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


Search completed: August 25, 2006, 01:15:15 
Job time : 18 6 sees 


SCORE 1.3 BuildDate: 12/06/2005 
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SCORE Search Results Details for Application 
08819669 and Search Result us-08-819-669e- 
26-rapbn. 

Score Home Retrieve Application SCORE System SCORE Comments / 

Page List Overview FAQ Suggestions 

This page gives you Search Results detail for the Application 08819669 and Search Result us-08-81 

669e-26.rapbn. 

start 

Go Back to previous p a 

GenCore version 5.1.9 
Copyright (c) 1993 - 2006 Biocceleration Ltd. 


OM protein - protein search, using sw model 


Run on: August 25, 2006, 01:12:19 ; Search time 32 Seconds 

(without alignments) 
19.244 Million cell updates/sec 


Title : 

Perfect score: 
Sequence : 


US-08-819-669E-26 
52 

1 EADPTGHSY 9 


Scoring table: 


BLOSUM62 

Gapop 10.0 , Gapext 0.5 


Searched : 


247503 seqs, 68422524 residues 


Total number of hits satisfying chosen parameters: 


247503 


Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 


Database : Published_Applications_AA_New: * 

1 : /EMC_Celerra_SIDS3/ptodata/l/pubpaa/US09_NEW_PUB.pep:* 

2 : /EMC_Celerra_SIDS3/ptodata/l/pubpaa/US06_NEW_PUB.pep:* 

3 : /EMC_CelerraJSIDS3/ptodata/l/pubpaa/US07_NEW_PUB.pep:* 

4 : /EMC_Celerra_SIDS3/ptodata/l/pubpaa/US08_NEW_PUB.pep: * 

5 : /EMC_Celerra_SIDS3/ptodata/l/pubpaa/PCT_NEW_PUB .pep : * 

6: /EMC_Celerra_SIDS3/ptodata/l/pubpaa/US10_NEW_PUB.pep:* 

7 : /EMC_Celerra_SIDS3/ptodata/l/pubpaa/USll_NEW_PUB.pep:* 

8 : /EMC_Celerra_SIDS3/ptodata/l/pubpaa/US60_NEW_PUB.pep:* 


Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 

% 

Result Query 
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No. Score Match Length DB ID 


Description 


1 

52 

100 

0 

9 

6 

US- 

10 

a m 

-4 y / - 

Uoo-4 

Sequence 

4 , Appli 

2 

52 

100 

0 

9 

/ 

US- 

11 

-Zdj- 


Sequence 

ZOf Appl 

3 

52 

100 

0 

9 

7 

US- 

11 

-313- 

152-354 

Sequence 

354, App 

4 

52 

100 

0 

9 

7 

us- 

11 

-313- 

152-553 

Sequence 

553, App 

5 

52 

100 

0 

9 

7 

US- 

11 

-313- 

ICO C tl o 

152-563 

Sequence 

DbJ, App 

6 

52 

100 

0 

309 

7 

us- 

11 

-323- 

049-5 

Sequence 

5, Appli 

7 

52 

100 

0 

309 

7 

us- 

11 

-323- 

964-5 

Sequence 

5, Appli 

8 

52 

100 

0 

1052 

6 

us- 

10 

-497- 

088-21 

Sequence 

21, Appl 

9 

52 

100 

0 

1342 

6 

us- 

10 

-497- 

088-14 

Sequence 

14, Appl 

10 

42 

80 

8 

9 

7 

us- 

11 

-313- 

152-558 

Sequence 

558, App 

11 

40 

76 

9 

9 

7 

us- 

11 

-313- 

152-559 

Sequence 

559, App 

12 

37 

71 

2 

1049 

6 

us- 

10 

-539- 

228-343 

Sequence 

343, App 

13 

36 

69 

2 

9 

6 

us- 

10 

-538- 

066-230 

Sequence 

230, App 

14 

36 

69 

2 

9 

6 

us- 

10 

-538- 

066-231 

Sequence 

231, App 

15 

36 

69 

2 

9 

6 

us- 

10 

-506- 

334-2 

Sequence 

2, Appli 

16 

36 

69 

2 

9 

6 

us- 

10 

-506- 

334-19 

Sequence 

19, Appl 

17 

36 

69 

2 

9 

7 

us- 

11 

-313- 

152-357 

Sequence 

357, App 

18 

36 

69 

2 

9 

7 

us- 

11 

-313- 

152-534 

Sequence 

534, App 

19 

36 

69 

2 

9 

7 

us- 

11 

-313- 

152-535 

Sequence 

535, App 

20 

36 

69 

2 

9 

7 

us- 

11 

-313- 

152-551 

Sequence 

551, App 

21 

36 

69 

2 

10 

6 

us- 

10 

-538- 

066-732 

Sequence 

732, App 

22 

36 

69 

.2 

11 

6 

us- 

10 

-538- 

066-229 

Sequence 

229, App 

23 

36 

69 

.2 

11 

6 

us- 

10 

-538- 

066-723 

Sequence 

723, App 

24 

36 

69 

.2 

314 

6 

us- 

10 

-538- 

066-366 

Sequence 

366, App 

25 

36 

69 

.2 

314 

7 

us- 

11 

-323- 

049-6 

Sequence 

6, Appli 

26 

36 

69 

.2 

314 

7 

us- 

11 

-323- 

964-6 

Sequence 

6, Appli 

27 

36 

69 

.2 

518 

6 

us- 

10 

-449- 

902-48443 

Sequence 

48443, A 

28 

35 

67 

. 3 

293 

6 

us- 

10 

-449- 

902-53971 

Sequence 

53971, A 

29 

35 

67 

. 3 

302 

7 

us- 

11 

-056- 

355B-83479 

Sequence 

83479, A 

30 

35 

67 

.3 

526 

7 

us- 

11 

-056- 

355B-83478 

Sequence 

83478, A 

31 

35 

67 

.3 

574 

7 

us- 

11 

-056- 

355B-83477 

Sequence 

83477, A 

32 

35 

67 

. 3 

1139 

6 

us- 

10 

-449- 

902-52733 

Sequence 

52733, A 

33 

35 

67 

. 3 

1469 

7 

us- 

11 

-330- 

403-6435 

Sequence 

64 35, Ap 

34 

34 

65 

.4 

299 

7 

us- 

11 

-293- 

697-3999 

Sequence 

3999, Ap 

35 

34 

65 

.4 

393 

7 

us- 

11 

-330- 

403-827 

Sequence 

827, App 

36 

33 

63 

.5 

9 

7 

us- 

11 

-313- 

152-557 

Sequence 

557, App 

37 

33 

63 

.5 

61 

6 

us- 

10 

-449- 

902-34383 

Sequence 

34383, A 

38 

33 

63 

. 5 

138 

6 

us- 

10 

-953- 

349-6081 

Sequence 

6081, Ap 

39 

33 

63 

. 5 

138 

7 

us- 

11 

-056- 

355B-28382 

Sequence 

28382, A 

40 

33 

63 

.5 

138 

7 

us- 

11 

-056- 

355B-30643 

Sequence 

30643, A 

41 

33 

63 

.5 

138 

7 

us- 

11 

-056- 

355B-31972 

Sequence 

31972, A 

42 

33 

63 

.5 

138 

7 

us- 

11 

-056- 

355B-34233 

Sequence 

34233, A 

43 

33 

63 

.5 

138 

7 

us- 

11 

-056- 

-355B-97528 

Sequence 

97528, A 

44 

33 

63 

.5 

138 

7 

us- 

11 

-056- 

-355B-102911 

Sequence 

102911, 

45 

33 

63 

.5 

138 

7 

us- 

11 

-056- 

-355B-108767 

Sequence 

108767, 


ALIGNMENTS 


RESULT 1 
US-10-497-088-4 

; Sequence 4, Application US/10497088 
; Publication No. US20060088520A1 
; GENERAL INFORMATION: 
; APPLICANT: Crucell Holland B.V. 

APPLICANT: Germeraad, Wilfred 

APPLICANT: Logtenberg, Ton 

APPLICANT: Lekker kerker , Annemarie N 
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TITLE OF INVENTION: Antigen presenting cell targeting conjugate, an antigen 
TITLE OF INVENTION: presenting cell contacted with such conjugate, their use for 
TITLE OF INVENTION: vaccination or as medicament, and methods for their production 
TITLE OF INVENTION: generation 

; FILE REFERENCE: 0070 US 00 CON 

; CURRENT APPLICATION NUMBER: US/10/4 97 , 088 

; CURRENT FILING DATE: 2004-05-28 

; PRIOR APPLICATION NUMBER: PCT/EP01/14255 

; PRIOR FILING DATE: 2001-11-30 

; PRIOR APPLICATION NUMBER: PCT/EP02/13681 

; PRIOR FILING DATE: 2002-11-29 

; PRIOR APPLICATION NUMBER: EP01204997.9 

; PRIOR FILING DATE: 2001-12-19 

; NUMBER OF SEQ ID NOS : 21 

SOFTWARE: Patentln version 3.2 

; SEQ ID NO 4 
LENGTH: 9 
TYPE: PRT 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: MAGE-1.A1 specific peptide 
US-10-497-088-4 

Query Match 100.0%; Score 52; DB 6; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.3e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 2 

US-11-253-240-26 

; Sequence 26, Application US/11253240 
; Publication No. US20060127356A1 
GENERAL INFORMATION: 

APPLICANT: Gaugler, Batrice; Van den Eynde, BenoEt; 

van der Bruggen, Pierre; Boon-Falleur , Thierry 
TITLE OF INVENTION: Isolated Nucleic Acid Molecules Coding For 
; Tumor Rejection Antigen Precursor Mage-3 And Uses Thereof 

NUMBER OF SEQUENCES: 30 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 
STREET: 805 Third Avenue 
CITY: New York City 
STATE: New York 
ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 
"COMPUTER: IBM 
OPERATING SYSTEM: PC-DOS 
SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/11/253,240 
FILING DATE: 17-Oct-2005 
CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/09/579,543 
FILING DATE: 2 6-May-2000 
APPLICATION NUMBER: 09/583,850 
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FILING DATE: 

APPLICATION NUMBER: PCT/US92/04354 
FILING DATE: 22-MAY-1992 
APPLICATION NUMBER: 07/807,043 
FILING DATE: 12 -DECEMBER- 19 91 
APPLICATION NUMBER: 07/764,365 
FILING DATE: 23-SEPTEMBER-1991 
APPLICATION NUMBER: 07/728,838 
FILING DATE: 9-JULY-1991 
APPLICATION NUMBER: 07/705,702 
FILING DATE: 23-MAY-1991 

ATTORNEY /AGENT INFORMATION: 
NAME: Hanson, Norman D. 
REGISTRATION NUMBER: 30,946 
REFERENCE/DOCKET NUMBER: LUD 5353 

TELECOMMUNICATION INFORMATION: 
TELEPHONE : {212 ) 688-9200 
TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 26: 

SEQUENCE CHARACTERISTICS: 
LENGTH: 9 amino acids 
TYPE: amino acids 
TOPOLOGY: linear 

MOLECULE TYPE: protein 

SEQUENCE DESCRIPTION: SEQ ID NO: 26: 


Query Match 100.0%; Score 52; DB 7; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.3e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

II I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 3 

US-11-313-152-354 

; Sequence 354, Application US/11313152 
; Publication No. US20060153858A1 
; GENERAL INFORMATION: 

APPLICANT: Kundig, Thomas M. 
; APPLICANT: Simard, John J. L. 

; TITLE OF INVENTION: METHOD OF INDUCING A CTL RESPONSE 

FILE REFERENCE: MANNK . 001CP2C1 
; CURRENT APPLICATION NUMBER: US/11/313,152 
; CURRENT FILING DATE: 2005-12-19 
; PRIOR APPLICATION NUMBER: 09/776,232 
; PRIOR FILING DATE: 2001-02-02 
; PRIOR APPLICATION NUMBER: 09/380,534 
; PRIOR FILING DATE: 1999-09-01 
; PRIOR APPLICATION NUMBER: PCT/US98/14289 
; PRIOR FILING DATE: 1998-07-10 

PRIOR APPLICATION NUMBER: 08/988,320 

PRIOR FILING DATE: 1997-12-10 

PRIOR APPLICATION NUMBER: CA 2,209,815 

PRIOR FILING DATE: 1997-07-10 
; NUMBER OF SEQ ID NOS : 569 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 354 
LENGTH: 9 
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TYPE: PRT 

ORGANISM: Homo Sapiens 
US-11-313-152-354 

Query Match 100.0%; Score 52; DB 7; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.3e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 4 

US-11-313-152-553 

; Sequence 553, Application US/11313152 

; Publication No. US20060153858A1 

; GENERAL INFORMATION : 

; APPLICANT: Kundig, Thomas M. 

; APPLICANT: Simard, John J. L. 

; TITLE OF INVENTION: METHOD OF INDUCING A CTL RESPONSE 

; FILE REFERENCE: MANNK. 001CP2C1 

; CURRENT APPLICATION NUMBER: US/11/313,152 

; CURRENT FILING DATE: 2005-12-19 

; PRIOR APPLICATION NUMBER: 09/776,232 

PRIOR FILING DATE: 2001-02-02 
; PRIOR APPLICATION NUMBER: 09/380,534 

PRIOR FILING DATE: 1999-09-01 
; PRIOR APPLICATION NUMBER: PCT/US98/1428 9 
; PRIOR FILING DATE: 1998-07-10 
; PRIOR APPLICATION NUMBER: 08/988,320 

PRIOR FILING DATE: 1997-12-10 
; PRIOR APPLICATION NUMBER: CA 2,209,815 
; PRIOR FILING DATE: 1997-07-10 
; NUMBER OF SEQ ID NOS : 569 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 553 
LENGTH : 9 
TYPE: PRT 

ORGANISM: Homo Sapiens 
US-11-313-152-553 

Query Match 100.0%; Score 52; DB 7; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.3e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 5 

US-11-313-152-563 

; Sequence 563, Application US/11313152 

; Publication No. US20060153858A1 

; GENERAL INFORMATION: 

; APPLICANT: Kundig, Thomas M. 

; APPLICANT: Simard, John J. L. 

; TITLE OF INVENTION: METHOD OF INDUCING A CTL RESPONSE 

; FILE REFERENCE: MANNK. 00 1CP2C1 

; CURRENT APPLICATION NUMBER: US/11/313,152 
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; CURRENT FILING DATE: 2005-12-19 

; PRIOR APPLICATION NUMBER: 09/776,232 

; PRIOR FILING DATE: 2001-02-02 

; PRIOR APPLICATION NUMBER: 09/380,534 

; PRIOR FILING DATE: 1999-09-01 

; PRIOR APPLICATION NUMBER: PCT/US98/14289 

; PRIOR FILING DATE: 1998-07-10 

; PRIOR APPLICATION NUMBER: 08/988,320 

; PRIOR FILING DATE: 1997-12-10 

; PRIOR APPLICATION NUMBER: CA 2,209,815 

; PRIOR FILING DATE: 1997-07-10 

; NUMBER OF SEQ ID NOS : 569 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 5 63 

LENGTH: 9 

TYPE : PRT 

ORGANISM: Homo Sapiens 
US-11-313-152-563 

Query Match 100.0%; Score 52; DB 7; Length 9; 

Best Local Similarity 100.0%; Pred. No. 2.3e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 6 
US-11-323-049-5 

; Sequence 5, Application US/11323049 

; Publication No. US20060159694A1 

; GENERAL INFORMATION: 

; APPLICANT: Chiang, Chih-Sheng 

; APPLICANT: Simard, John J.L. 

; APPLICANT: Diamond, David C. 

; APPLICANT: Bot, Adrian Ion 

; APPLICANT: Liu , Xiping 

TITLE OF INVENTION : COMBINATIONS OF TUMOR- ASSOC I AT ED 

TITLE OF INVENTION: ANTIGENS IN COMPOSITIONS FOR VARIOUS TYPES OF CANCERS 

FILE REFERENCE: MANNK . 0 4 9 A 
; CURRENT APPLICATION NUMBER: US/11/323,049 
; CURRENT FILING DATE: 2005-12-29 

PRIOR APPLICATION NUMBER: 60/640,598 

PRIOR FILING DATE: 2004-12-29 
; NUMBER OF SEQ ID NOS: 2 6 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 5 

LENGTH: 309 
TYPE: PRT 

ORGANISM: Homo sapiens 
US-11-323-049-5 


Query Match 100.0%; Score 52; DB 7; Length 309; 

Best Local Similarity 100.0%; Pred. No. 0.033; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I I II I I 
Db 161 EADPTGHSY 169 
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RESULT 7 
US-11-323-964-5 

Sequence 5, Application US/11323964 
Publication No. US20060159689A1 
GENERAL INFORMATION: 
APPLICANT: Chiang, Chih-Sheng 
APPLICANT: Simard, John J.L. 
APPLICANT: Diamond, David C. 
APPLICANT: Bot, Adrian Ion 
APPLICANT: Liu, Xiping 

TITLE OF INVENTION: COMBINATIONS OF TUMOR-ASSOCIATED 

TITLE OF INVENTION: ANTIGENS IN DIAGNOSTICS FOR VARIOUS TYPES OF CANCERS 
FILE REFERENCE: MANNK. 050CP1 
CURRENT APPLICATION NUMBER: US/11/323,964 
CURRENT FILING DATE: 2005-12-29 
PRIOR APPLICATION NUMBER: 11/155,288 
PRIOR FILING DATE: 2005-06-17 

PRIOR APPLICATION NUMBER: PCT/US2005/02 1836 
PRIOR FILING DATE: 2005-06-17 
PRIOR APPLICATION NUMBER: 60/580,969 
PRIOR FILING DATE: 2004-06-17 
NUMBER OF SEQ ID NOS : 44 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 5 
LENGTH: 309 
TYPE: PRT 

ORGANISM: Homo sapiens 
US-11-323-964-5 

Query Match 100.0%; Score 52; DB 7; Length 309; 

Best Local Similarity 100.0%; Pred. No. 0.033; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 161 EADPTGHSY 169 


RESULT 8 

US-10-497-088-21 

; Sequence 21, Application US/10497088 

; Publication No. US20060088520A1 

; GENERAL INFORMATION: 

; APPLICANT: Crucell Holland B.V. 

; APPLICANT: Germeraad, Wilfred 

APPLICANT: Logtenberg, Ton 

APPLICANT: Lekkerkerker , Annemarie N 

TITLE OF INVENTION: Antigen presenting cell targeting conjugate, an antigen 
TITLE OF INVENTION: presenting cell contacted with such conjugate, their use for 
TITLE OF INVENTION: vaccination or as medicament, and methods for their production 
TITLE OF INVENTION: generation 

; FILE REFERENCE: 0070 US 00 CON 

; CURRENT APPLICATION NUMBER: US/10/4 97,088 

; CURRENT FILING DATE: 2004-05-28 

PRIOR APPLICATION NUMBER: PCT/EP01/14255 

; PRIOR FILING DATE: 2001-11-30 

; PRIOR APPLICATION NUMBER: PCT/EP02/13681 

; PRIOR FILING DATE: 2002-11-29 

; PRIOR APPLICATION NUMBER: EP01204997.9 
PRIOR FILING DATE: 2001-12-19 
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; NUMBER OF SEQ ID NOS : 21 

; SOFTWARE: Patentln version 3.2 

; SEQ ID NO 21 

LENGTH: 1052 

TYPE: PRT 

ORGANISM: Artificial 
FEATURE : 

OTHER INFORMATION: MatDC16-Cgamma4-MAGE-l 
FEATURE : 
; . NAME /KEY : misc_f eature 
LOCATION: (546) . . (546) 

OTHER INFORMATION: Xaa can be any naturally occurring amino acid 
US-10-497-088-21 

Query Match 100.0%; Score 52; DB 6; Length 1052; 

Best Local Similarity 100.0%; Pred. No. 0.11; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I t I I I 
Db 904 EADPTGHSY 912 


RESULT 9 

US-10-497-088-14 

; Sequence 14, Application US/10497088 

; Publication No. US20060088520A1 

; GENERAL INFORMATION: 

; APPLICANT: Crucell Holland B.V. 

; APPLICANT: Germeraad, Wilfred 

; APPLICANT: Logtenberg, Ton 

; APPLICANT: Lekkerkerker , Annemarie N 

TITLE OF INVENTION: Antigen presenting cell targeting conjugate, an antigen 

TITLE OF INVENTION: presenting cell contacted with such conjugate, their use for 
; TITLE OF INVENTION: vaccination or as medicament, and methods for their production 

TITLE OF INVENTION: generation 

FILE REFERENCE: 0070 US 00 CON 
; CURRENT APPLICATION NUMBER: US/10/4 97,088 
; CURRENT FILING DATE: 2004-05-28 
; PRIOR APPLICATION NUMBER: PCT/EP01/14255 
; PRIOR FILING DATE: 2001-11-30 
; PRIOR APPLICATION NUMBER: PCT/EP02/13681 
; PRIOR FILING DATE: 2002-11-29 
; PRIOR APPLICATION NUMBER: EP01204997.9 
; PRIOR FILING DATE: 2001-12-19 
; NUMBER OF SEQ ID NOS: 21 

SOFTWARE: Patentln version 3.2 
; SEQ ID NO 14 

LENGTH: 1342 
TYPE : PRT 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Ma t DC 1 6 - C g amma 4 -MAGE - Al 
FEATURE : 

NAME/KEY: MISC_FEATURE 
LOCATION: (836) .. (836) 

OTHER INFORMATION: Xaa can be any amino acid 
US-10-497-088-14 

Query Match 100.0%; Score 52; DB 6; Length 1342; 

Best Local Similarity 100.0%; Pred. No. 0.14; 
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Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 161 EADPTGHSY 169 


RESULT 10 
US-11-313-152-558 

; Sequence 558, Application US/11313152 

; Publication No. US20060153858A1 

; GENERAL INFORMATION: 

; APPLICANT: Kundig, Thomas M. 

; APPLICANT: Simard, John J. L. 

; TITLE OF INVENTION: METHOD OF INDUCING A CTL RESPONSE 

FILE REFERENCE: MANNK . 001CP2C1 
; CURRENT APPLICATION NUMBER: US/11/313,152 
; CURRENT FILING DATE: 2005-12-19 
; PRIOR APPLICATION NUMBER: 09/776,232 
; PRIOR FILING DATE: 2001-02-02 
; PRIOR APPLICATION NUMBER: 09/380,534 

PRIOR FILING DATE: 1999-09-01 

PRIOR APPLICATION NUMBER: PCT/US98/1428 9 
; PRIOR FILING DATE: 1998-07-10 
; PRIOR APPLICATION NUMBER: 08/988,320 
; PRIOR FILING DATE: 1997-12-10 
; PRIOR APPLICATION NUMBER: CA 2,209,815 
; PRIOR FILING DATE: 1997-07-10 
; NUMBER OF SEQ ID NOS : 569 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 5 58 
LENGTH: 9 
TYPE: PRT 

ORGANISM: Homo Sapiens 
FEATURE : 

NAME /KEY : VARIANT 
LOCATION: (1) ... (9) 

OTHER INFORMATION: Xaa = Any Amino Acid 
US-11-313-152-558 

Query Match 80.8%; Score 42; DB 7; Length 9; 

Best Local Similarity 77.8%; Pred. No. 2.3e+05; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0 

Qy 1 EADPTGHSY 9 

till II I 
Db 1 EADPIGHXY 9 


RESULT 11 
US-11-313-152-559 

; Sequence 559, Application US/11313152 

; Publication No. US20060153858A1 

; GENERAL INFORMATION: 

; APPLICANT: Kundig, Thomas M. 

; APPLICANT: Simard, John J. L. 

; TITLE OF INVENTION: METHOD OF INDUCING A CTL RESPONSE 

; FILE REFERENCE: MANNK . 00 1CP2C1 

; CURRENT APPLICATION NUMBER: US/11/313,152 

; CURRENT FILING DATE: 2005-12-19 

; PRIOR APPLICATION NUMBER: 09/776,232 
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; PRIOR FILING DATE: 2001-02-02 

; PRIOR APPLICATION NUMBER : 09/380,534 

; PRIOR FILING DATE: 1999-09-01 

; PRIOR APPLICATION NUMBER : PCT/US98/1428 9 

; PRIOR FILING DATE: 1998-07-10 

; PRIOR APPLICATION NUMBER: 08/988,320 

; PRIOR FILING DATE: 1997-12-10 

; PRIOR APPLICATION NUMBER: CA 2,209,815 

; PRIOR FILING DATE: 1997-07-10 

; NUMBER OF SEQ ID NOS : 569 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 559 
"LENGTH: 9 
TYPE : PRT 

ORGANISM: Homo Sapiens 
US-11-313-152-559 


Query Match 76.9%; Score 40; DB 7; Length 9; 

Best Local Similarity 77.8%; Pred. No. 2.3e+05; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I II I 
Db 1 EADPIGHLY 9 


RESULT 12 
US-10-539-228-343 

; Sequence 343, Application US/10539228 

; Publication No. US20060154250A1 

; GENERAL INFORMATION: 

; APPLICANT: David W. Morris 

; APPLICANT: Marc S . Malandro 

; TITLE OF INVENTION: Novel Compositions and Methods in Cancer 

; FILE REFERENCE: CHIR0052-101 ( PP023370 . 0003 ) 

; CURRENT APPLICATION NUMBER: US/10/539,228 

; CURRENT FILING DATE: 2005-06-17 

; PRIOR APPLICATION NUMBER: US 10/322,281 

; PRIOR FILING DATE: 2002-12-18 

; NUMBER OF SEQ ID NOS: 8 66 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 343 

LENGTH: 104 9 

TYPE: PRT 

ORGANISM: Mus mus cuius 
US-10-539-228-343 

Query Match 71.2%; Score 37; DB 6; Length 1049; 

Best Local Similarity 100.0%; Pred. No. 68; 

Matches 6; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 4 PTGHSY 9 

I I I I I I 

Db 52 PTGHSY 57 


RESULT 13 
US-10-538-066-230 

; Sequence 230, Application US/10538066 
; Publication No. US20060094 649A1 
; GENERAL INFORMATION: 
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APPLICANT: Epimmune Inc. 

TITLE OF INVENTION: HLA-A1, -A2, -A3, -A24, -B7, and -B44 Tumor Associated Antigen 

TITLE OF INVENTION: Peptides and Compositions 
; FILE REFERENCE: 2060.015PC06 
; CURRENT APPLICATION NUMBER: US/10/538,066 
; CURRENT FILING DATE: 2005-06-09 
; PRIOR APPLICATION NUMBER: US 60/432,017 
; PRIOR FILING DATE: 2002-12-10 
; NUMBER OF SEQ ID NOS : 7 67 

SOFTWARE: Patentln version 3.2 
; SEQ ID NO 2 30 
LENGTH : 9 
TYPE : PRT 

ORGANISM: Homo sapiens 
US-10-538-066-230 

Query Match 69.2%; Score 36; DB 6; Length 9; 

Best Local Similarity 66.7%; Pred. No. 2.3e+05; 

Matches 6; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I 
Db 1 EVDPIGHLY 9 


RESULT 14 
US-10-538-066-231 

; Sequence 231, Application US/10538066 

; Publication No. US20060094649A1 

; GENERAL INFORMATION: 

; APPLICANT: Epimmune Inc. 

TITLE OF INVENTION: HLA-Al, -A2 , -A3, -A24, -B7, and -B4 4 Tumor Associated Antigen 

TITLE OF INVENTION: Peptides and Compositions 

FILE REFERENCE: 2060.015PC06 
; CURRENT APPLICATION NUMBER: US/10/538,066 
; CURRENT FILING DATE: 2005-06-09 

PRIOR APPLICATION NUMBER: US 60/432,017 

PRIOR FILING DATE: 2002-12-10 
; NUMBER OF SEQ ID NOS: 7 67 
; SOFTWARE: Patentln version 3.2 
; SEQ ID NO 2 31 
LENGTH: 9 
TYPE : PRT 

ORGANISM: Homo sapiens 
US-10-538-066-231 

Query Match 69.2%; Score 36; DB 6; Length 9; 

Best Local Similarity 66.7%; Pred. No. 2.3e+05; 

Matches 6; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I 
Db 1 ETDPIGHLY 9 


RESULT 15 
US-10-506-334-2 

; Sequence 2, Application US/10506334 
; Publication No. US20060122119A1 
; GENERAL INFORMATION: 
; APPLICANT: LINARD, BORIS 
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APPLICANT: JOTEREAU, FRANC INE 
APPLICANT: BENLALAM, HOUSSEM 
APPLICANT: DIEZ, ELIZABETH 
APPLICANT: GUILLOUX, YANNICK 
APPLICANT: LABARRIERE, NATHALIE 
APPLICANT: GERVOIS, NAD INE 
APPLICANT: DERRE, LAURENT 

TITLE OF INVENTION: PEPTIDES FOR USE IN ANTITUMOR IMMUNOTHERAPY 
FILE REFERENCE: 258087US0XPCT 
CURRENT APPLICATION NUMBER: US/10/506,334 
CURRENT FILING DATE: 2004-09-02 
PRIOR APPLICATION NUMBER: PCT/ FR03/00698 
PRIOR FILING DATE: 2003-03-04 
PRIOR APPLICATION NUMBER: FR 02/02703 
PRIOR FILING DATE: 2002-03-04 
NUMBER OF SEQ ID NOS : 35 
SOFTWARE: Patentln version 3.3 
SEQ ID NO 2 
LENGTH: 9 
TYPE : PRT 

ORGANISM: Homo sapiens 
US-10-506-334-2 


Query Match 69.2%; 
Best Local Similarity 66.7%; 
Matches 6; Conservative 


Score 36; DB 6; Length 9; 
Pred. No. 2.3e+05; 
0; Mismatches 3; Indels 


Gaps 


Qy 


Db 


1 EADPTGHSY 9 

I I I I I I 
1 EVDPIGHVY 9 


Search completed: August 25, 2006, 01:15:52 
Job time : 33 sees 


SCORE 1.3 BuildDate: 12/06/2005 
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SCORE Search Results Details for Application 
08819669 and Search Result us-08-819-669e 

26-rapm- 


Score Home Page Retrieve Application List SCORE System Overview SCORE FAQ Comments / Sugg 

This page gives you Search Results detail for the Application 08819669 and Search Result us-08-81 

26.rapm. 

start 

Go Back to previ 

GenCore version 5.1.9 
Copyright (c) 1993 - 2006 Biocceleration Ltd. 


OM protein 


Run on: 


protein search, using sw model 
August 25, 2006, 01:00:27 ; 


Search time 604 Seconds 
(without alignments) 
22.753 Million cell updates/sec 


Title: US-08-81 9-669E-2 6 

Perfect score: 52 

Sequence: 1 EADPTGHSY 9 

Scoring table: BLOSUM62 

Gapop 10.0 , Gapext 0.5 

Searched: 8366291 seqs, 1526956180 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 


8366291 


Database 


Pending^ 
/EMC~ 
/EMC~ 
/EMC" 
/EMC" 
/EMC~ 
/EMC~ 
/EMC~ 
/EMC~ 
/EMC _ _ 
/EMC 
/EMC 
/EMC 
/EMC 
/EMC 
/EMC 
/EMC 
/EMC 


1 
2 
3 
4 
5 
6 
7 
8 
9 

10 
11 
12 
13 
14 
15 
16 
17 


Patents_AA_Main: * 

Celerra_SIDS3/ptodata/2/paa/PCTUS 
Celerra_SIDS3/ptodata/2/paa/US066 
Celerra_SIDS3/ptodata/2/paa/US07 3 
Celerra_SIDS3/ptodata/2/paa/US07 4 
Celerra_SIDS3/ptodata/2/paa/US075 
Celerra_SIDS3/ptodata/2/paa/US07 6 
Celerra_SIDS3/ptodata/2/paa/US07 7 
*Celerra_SIDS3/ptodata/2/paa/US078 
Celerra_SIDS3/ptodata/2/paa/US07 9 
" Celerra_SIDS3/ptodata/2/paa/US08 
~Celerra_SIDS3/ptodata/2/paa/US08 
Celerra_SIDS3/ptodata/2/paa/US08 
Celerra_SIDS3/ptodata/2/paa/US08 
Celerra_SIDS3/ptodata/2/paa/US08 
~Celerra_SIDS3/ptodata/2/paa/US08 
Celerra_SIDS3/ptodata/2/paa/US08 
^Celerra_SIDS3/ptodata/2/paa/US08 


COMB . pep 
COMB. pep 
COMB. pep 
COMB . pep 
COMB. pep 
COMB. pep 
COMB . pep 
COMB. pep 
COMB. pep 
0 _ _COMB . pep 
l_COMB.pep 
2_COMB.pep 
3_COMB.pep 
4_COMB.pep 
5_COMB.pep 
6_COMB.pep 
7_COMB.pep 
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18 : /EMC_Celerra_SIDS3/ptodata/2/paa/US088_COMB.pep: * 

19: /EMC_Celerra_SIDS3/ptodata/2/paa/US08 9_COMB.pep:* 

20: /EMC_Celerra_SIDS3/ptodata/2/paa/US090_COMB.pep:* 

21: /EMC_Celerra_SIDS3/ptodata/2/paa/US091_COMB.pep:* 

22 : /EMC_Celerra_SIDS3/ptodata/2/paa/US092_COMB.pep:* 

23: /EMC_Celerra_SIDS3/ptodata/2/paa/US093_COMB.pep:* 

24 : /EMC_Celerra_SIDS3/ptodata/2/paa/US094_COMB.pep:* 

25: /EMC_Celerra_SIDS3/ptodata/2/paa/US095_COMB.pep:* 

2 6 : /EMC_Celerra_SIDS3/ptodata/2/paa/US09 6_COMB . pep : * 

27: /EMC_Celerra_SIDS3/ptodata/2/paa/US097_COMB.pep:* 

28 : /EMC_Celerra_SIDS3/ptodata/2/paa/US098_COMB.pep: * 

29: /EMC_Celerra_SIDS3/ptodata/2/paa/US099_COMB.pep: * 

30: /EMC_Celerra_SIDS3/ptodata/2/paa/US100_COMB.pep: * 

31 : /EMC_Celerra_SIDS3/ptodata/2/paa/US101_COMB.pep: * 

32: /EMC_Celerra_SIDS3/ptodata/2/paa/US102_COMB.pep:* 

33: /EMC_Celerra_SIDS3/ptodata/2/paa/US103_COMB.pep:* 

34 : /EMC_Celerra_SIDS3/ptodata/2/paa/US104_COMB.pep:+ 

35 : /EMC_Celerra_SIDS 3/ptodata/2/paa/US105_COMB . pep : * 

36: /EMC_Celerra_SIDS3/ptodata/2/paa/US106_COMB.pep:* 

37 : /EMC_Celerra_SIDS3/ptodata/2/paa/US107_COMB.pep:* 

38: /EMC_Celerra_SIDS3/ptodata/2/paa/US108_COMB.pep:* 

39: /EMC_Celerra_SIDS3/ptodata/2/paa/US109_COMB.pep:* 

40: /EMC_Celerra_SIDS3/ptodata/2/paa/US110_COMB.pep:* 

41 : /EMC_Celerra_SIDS3/ptodata/2/paa/USlll_COMB.pep:* 

42 : /EMC_Celerra_SIDS3/ptodata/2/paa/US112_COMB.pep:* 

4 3 : /EMC_Celerra_SIDS3/ptodata/2/paa/US113_COMB . pep : * 

44 : /EMC_Celerra_SIDS3/ptodata/2/paa/US114_COMB.pep:* 

45: /EMC_CelerraJ3IDS3/ptodata/2/paa/US600_COMB.pep:* 

4 6 : /EMC_Celerra_SIDS3/ptodata/2/paa/US60 l_COMB . pep : * 

4 7 : /EMC_Celerra_SIDS3/ptodata/2/paa/US602_COMB . pep : * 

48: /EMC_Celerra_SIDS3/ptodata/2/paa/US603_COMB.pep:* 

4 9 : /EMC_Celerra_SIDS3/ptodata/2/paa/US604_COMB . pep : * 

50: /EMC_Celerra_SIDS3/ptodata/2/paa/US605_COMB.pep: * 

51 : /EMC_Celerra_SIDS3/ptodata/2/paa/US606_COMB.pep: * 

52 : /EMC_Celerra_SIDS3/ptodata/2/paa/US607_COMB.pep:* 


Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 


SUMMARIES 


Result 
No. 


% 

Query 

Score Match Length DB ID 


Description 


1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
11 
12 
13 
14 
15 
16 


52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 

52 100.0 


9 1 PCT-IL03-00501A-30 

9 1 PCT-US00-04326-8 

9 1 PCT-US00-25559-3 

9 1 PCT-US01-20182-23 

9 1 PCT-US03-16736-9 

9 1 PCT-US03-17641-20 

9 1 PCT-US03-30031A-10 

9 1 PCT-US04-04340-118 

9 1 PCT-US05-10597-1 

9 1 PCT-US98-01499-49 

9 1 PCT-US99-20344-16 

9 9 US-07-926-666-27 

9 10 US-08-027-746-49 

9 11 US-08-103-396A-54 


9 11 US-08-103-396A-549 
9 11 US-08-103-396A-634 


Sequence 30, Appl 
Sequence 8, Appli 
Sequence 3, Appli 
Sequence 23, Appl 
Sequence 9, Appli 
Sequence 20, Appl 
Sequence 10, Appl 
Sequence 118, App 
Sequence 1, Appli 
Sequence 4 9, Appl 
Sequence 16, Appl 
Sequence 27, Appl 
Sequence 49, Appl 
Sequence 54, Appl 
Sequence 54 9, App 
Sequence 634, App 
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52 
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0 
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11 
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Sequence 
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DO/, App 
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100 
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Sequence 
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52 
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1, Appli 
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Sequence 
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26, Appl 
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52 

100 

0 

9 
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Sequence 
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lb, Appl 

23 

52 

100 

0 

9 

13 

us 
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-824A-18 

Sequence 

18, Appl 

24 

52 

100 

0 

9 

13 

us 
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-347 
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Sequence 

3 o 6 , App 

25 

52 

100 

0 

9 

13 

us 

-08 

-347 

-610A-356 

Sequence 

356, App 

26 

52 

100 

0 

9 

13 

us 

-08 

-347 

-610B-356 

Sequence 

356, App 

27 

52 

100 

0 

9 

13 

us 

-08 

-347 

-610C-356 

Sequence 

356, App 

28 

52 

100 

0 

9 

13 

us 

-08 

-354 

-679-12 

Sequence 

12, Appl 

29 

52 

100 

0 

9 

13 

us 

-08 

-354 

-679B-12 

Sequence 

1 2 , Appl 

30 

52 

100 

0 

9 

16 

us 

-08 

-651 

-925-67 

Sequence 

67, Appl 

31 

52 

100 

0 

9 

16 

us 

-08 

-651 

-925A-67 

Sequence 

67, Appl 

32 

52 

100 

. 0 

9 

18 

us 

-08 

-815 

-631-2 

Sequence 

2, Appli 

33 

52 

100 

. 0 

9 

18 

us 

-08 

-819 

-669-26 

Sequence 

O tl 7\ ww 1 

2 6, Appl 

34 

52 

100 

.0 

9 

18 

us 

-08 

-819 

-669D-26 

Sequence 

2 6, Appl 

35 

52 

100 

. 0 

9 

18 

us 

-08 

-819 

-669E-26 

Sequence 

2 6, Appl 

36 

52 

100 

.0 

9 

18 

us 

-08 

-820 

-360-1 

Sequence 

1, Appli 

37 

52 

100 

.0 

9 

18 

us 

-08 

-880 

-979-3 

Sequence 

3, Appli 

38 

52 

100 

.0 

9 

19 

us 

-08 

-922 

-869-12 

Sequence 

12, Appl 

39 

52 

100 

. 0 

9 

19 

us 

-08 

-922 

-869A-12 

Sequence 

12, Appl 

40 

52 

100 

. 0 

9 

19 

us 

-08 

-922 

-869B-12 

Sequence 

12, Appl 

41 

52 

100 

. 0 

9 

19 

us 

-08 

fi A A 

-94 4 

T A A 1 

-744-1 

Sequence 

1, Appli 

42 

52 

100 

.0 

9 

19 

us 

-08 

-992 

-124-1 

Sequence 

1, Appli 

43 

52 

100 

.0 

9 

20 

us 

-09 

-003 

-253-49 

Sequence 

4 9, Appl 

44 

52 

100 

.0 

9 

20 

us 

-09 
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-850-6 

Sequence 

6, Appli 

45 

52 

100 

.0 

9 

20 

us 

-09 

-060 

-706-4 

Sequence 

4, Appli 


ALIGNMENTS 


RESULT 1 

PCT-IL03-00501A-30 

; Sequence 30, Application PC/TIL0300501A 
; GENERAL INFORMATION: 

; APPLICANT: GAVISH -GALILEE BIO APPLICATIONS LTD. 
; APPLICANT: GROSS, Gideon 
; APPLICANT: MARGALIT, Alon 

; TITLE OF INVENTION: MEMBRANE -ANCHORED BETA- 2 MICROGLOBULIN COVALENTLY LINKED TO MHC 

; TITLE OF INVENTION: PEPTIDE EPITOPES 

; FILE REFERENCE: GAVISH-004 PCT 

; CURRENT APPLICATION NUMBER: PCT/IL03/00501A 

; CURRENT FILING DATE: 2003-06-12 

; PRIOR APPLICATION NUMBER: US 60/388,273 

; PRIOR FILING DATE: 2002-06-12 

; NUMBER OF SEQ ID NOS : 64 

SOFTWARE: Patentln version 3.1 
; SEQ ID NO 30 

LENGTH : 9 

TYPE: PRT 
; ORGANISM: Artificial Sequence 

FEATURE : 

OTHER INFORMATION: Synthetic 
PCT-IL03-00501A-30 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
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Qy 1 EADPTGHSY 9 

I I I i I I I I I 
Db 1 EADPTGHSY 9 


RESULT 2 

PCT-USOO-04326-8 

; Sequence 8, Application PC/TUS000432 6 

; GENERAL INFORMATION : 

; APPLICANT: Chiari, Rita 

APPLICANT: Coulie, Pierre G. 

APPLICANT: Boon-Falleur , Thierry 
; TITLE OF INVENTION: TYROSINE KINASE RECEPTOR EphA3 ANTIGENIC PEPTIDES 
; FILE REFERENCE: L04 61/7057WO 

; CURRENT APPLICATION NUMBER: PCT/USOO/04 32 6 

; CURRENT FILING DATE: 2000-02-18 

; EARLIER APPLICATION NUMBER: US 60/121,170 

; EARLIER FILING DATE: 1999-02-22 

; EARLIER APPLICATION NUMBER: US 60/158,566 

; EARLIER FILING DATE: 1999-10-08 

; NUMBER OF SEQ ID NOS : 63 

SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 8 

LENGTH: 9 

TYPE: PRT 
; ORGANISM: Homo sapiens 
PCT-US00-04326-8 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

II I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 3 

PCT-US00-25559-3 

; Sequence 3, Application PC/TUS0025559 
; GENERAL INFORMATION: 

APPLICANT: Zycos Inc. 
; TITLE OF INVENTION: NUCLEIC ACIDS ENCODING POLYEPITOPE POLYPEPTIDES 
; FILE REFERENCE: 08191-013WO1 
; CURRENT APPLICATION NUMBER: PCT/US00/25559 
; CURRENT FILING DATE: " 2000-09-18 
; PRIOR APPLICATION NUMBER: PCT/US00/25559 
; PRIOR FILING DATE: 2000-09-18 
; PRIOR APPLICATION NUMBER: US 60/169,846 
; PRIOR FILING DATE: 1999-12-09 
; PRIOR APPLICATION NUMBER: US 60/154,665 
; PRIOR FILING DATE: 1999-09-16 
; NUMBER OF SEQ ID NOS: 163 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 3 

LENGTH: 9 

TYPE: PRT 

ORGANISM: Homo sapiens 
PCT-US00-25559-3 
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Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 
Matches 9; Conservative 0; Mismatches 0; Indels 


0; Gaps 0; 


Qy 1 EADPTGHSY 9 

MINIMI 
Db 1 EADPTGHSY 9 


RESULT 4 

PCT-US01-20182-23 

Sequence 23, Application PC/TUS0120182 
GENERAL INFORMATION: 
APPLICANT: Huston, James S. 
APPLICANT: Wils, Pierre 
APPLICANT: Zhu, Quan 
APPLICANT: Laurent, Olivier 
APPLICANT: Marasco, Wayne A. 
APPLICANT: Scherman, Daniel 

TITLE OF INVENTION: BIOENGINEERED VEHICLES FOR TARGETED NUCLEIC ACID 
TITLE OF INVENTION: DELIVERY 
FILE REFERENCE: 23 611-A USA 

CURRENT APPLICATION NUMBER: PCT/US01/20182 
CURRENT FILING DATE: 2001-06-25 
PRIOR APPLICATION NUMBER: 60/213,653 
PRIOR FILING DATE: 2000-06-23 
NUMBER OF SEQ ID NOS : 4 5 
SOFTWARE: Patentln Ver . 2.0 
SEQ ID NO 2 3 
LENGTH: 9 
TYPE: PRT 

ORGANISM: Homo sapiens 
PCT-US01-20182-23 


Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 
Matches 9; Conservative 0; Mismatches 0; Indels 


0 ; Gaps 


Qy 

Db 


1 EADPTGHSY 9 

M M M M I 
1 EADPTGHSY 9 


RESULT 5 

PCT-US03-16736-9 

; Sequence 9, Application PC/TUS0316736 

; GENERAL INFORMATION: 

; APPLICANT: Wang, Rong-fu 

; TITLE OF INVENTION: Mutant Fibronectin and Tumor Metastasis 
; FILE REFERENCE: HO-P02 48 4WO0 

; CURRENT APPLICATION NUMBER: PCT/US03/16736 

; CURRENT FILING DATE: 2003-05-28 

; PRIOR APPLICATION NUMBER: 60/383,530 

; PRIOR FILING DATE: 2002-05-28 

; NUMBER OF SEQ ID NOS: 148 

SOFTWARE: Patentln version 3.1 
; SEQ ID NO 9 

LENGTH: 9 

TYPE : PRT 
; ORGANISM: Artificial Sequence 

FEATURE : 
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OTHER INFORMATION: Synthetic Peptide 
PCT-US03-16736-9 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 6 

PCT-US03-17641-20 

Sequence 20, Application PC/TUS0317641 
GENERAL INFORMATION: 
APPLICANT: Bilsborough, Janine 
APPLICANT: Zhang, Yi 
APPLICANT: Schultz, Erwin 
APPLICANT: Panichelli, Chris tophe 
APPLICANT: Van der Bruggen, Pierre 
APPLICANT: Boon-Falleur, Thierry 
APPLICANT: Traversari, Catia 

TITLE OF INVENTION: Isolated Peptides Which Bind to HLA-B18 and Cwl6 Molecules Arid 
TITLE OF INVENTION: Thereof 
FILE REFERENCE: LUD-5756.1 PCT 
CURRENT APPLICATION NUMBER: PCT/US03/17 641 
CURRENT FILING DATE: 2003-06-04 
PRIOR APPLICATION NUMBER: US 10/164,078 
PRIOR FILING DATE: 2002-06-05 
PRIOR APPLICATION NUMBER: US 10/164,121 
PRIOR FILING DATE: 2002-06/05 
NUMBER OF SEQ ID NOS : 37 
SEQ ID NO 2 0 
LENGTH: 9 
TYPE: PRT 

ORGANISM: H. sapiens 
FEATURE : 
PCT-US03-17641-20 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

MINIMI 
Db 1 EADPTGHSY 9 


RESULT 7 

PCT-US03-30031A-10 

; Sequence 10, Application PC/TUS0330031A 
; GENERAL INFORMATION: 

; APPLICANT: LUDWIG INSTITUTE FOR CANCER RESEARCH 

; TITLE OF INVENTION: MAGE C2 ANTIGENIC PEPTIDES AND USES THEREOF 

FILE REFERENCE: LUD 5780.2 PCT 
; CURRENT APPLICATION NUMBER: PCT/US03/30031A 
; CURRENT FILING DATE: 2003-09-26 

PRIOR APPLICATION NUMBER: 60/413,844 
; PRIOR FILING DATE: 2002-09-27 
; PRIOR APPLICATION NUMBER: 60/433,983 
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; PRIOR FILING DATE: 2002-12-18 

; PRIOR APPLICATION NUMBER: 60/459,263 

; PRIOR FILING DATE: 2003-04-02 

; NUMBER OF SEQ ID NOS : 105 

SOFTWARE: Patentln version 3.3 
; SEQ ID NO 10 

LENGTH : 9 

TYPE: PRT 

ORGANISM: Homo sapiens 
PCT-US03-30031A-10 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 

Qy 1 EADPTGHSY 9 

I I I I I i I I I 
Db 1 EADPTGHSY 9 


RESULT 8 

PCT-US04 -04340-118 

; Sequence 118, Application PC/TUS0404 340 
; GENERAL INFORMATION: 

APPLICANT: Antigenics, Inc. 
; TITLE OF INVENTION: IMPROVED HEAT SHOCK PROTEIN-BASED VACCINES AND 

TITLE OF INVENTION: IMMUNOTHERAPIES 

FILE REFERENCE: 8449-405-228 
; CURRENT APPLICATION NUMBER: PCT/US0 4/04 340 
; CURRENT FILING DATE: 2004-02-13 
; PRIOR APPLICATION NUMBER: 60/503,417 
; PRIOR FILING DATE: 2003-09-16 
; PRIOR APPLICATION NUMBER: 60/463,746 
; PRIOR FILING DATE: 2003-04-18 

PRIOR APPLICATION NUMBER:^ 60/462,469 
; PRIOR FILING DATE: 2003-04-11 

PRIOR APPLICATION NUMBER: 60/447,142 
; PRIOR FILING DATE: 2003-02-13 
; NUMBER OF SEQ ID NOS: 419 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 118 
LENGTH: 9 
TYPE : PRT 

ORGANISM: Homo sapiens 
PCT-US04-04340-118 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 9 

PCT-US05-10597-1 

; Sequence 1, Application PC/TUS0510597 

; GENERAL INFORMATION: 

; APPLICANT: Cytomatrix, LLC 

; APPLICANT: Pykett, Mark J. 
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APPLICANT: Rosenzweig, Michael 

TITLE OF INVENTION: METHODS FOR PRODUCTION OF REGULATORY T CELLS AND USES THEREOF 
; FILE REFERENCE: C1005 . 70014WO00 
; CURRENT APPLICATION NUMBER: PCT/US05/10597 
; CURRENT FILING DATE: 2005-03-29 
; PRIOR APPLICATION NUMBER: US 60/557,669 
; PRIOR FILING DATE: 2004-03-29 
; NUMBER OF SEQ ID NOS : 58 

SOFTWARE: Patentln version 3.3 
; SEQ ID NO 1 
LENGTH : 9 
TYPE: PRT 

ORGANISM: Artificial sequence 
FEATURE : 

OTHER INFORMATION: Homo sapiens source 
PCT-US05-10597-1 

Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 10 
PCT-US98-01499-49 

; Sequence 49, Application PC/TUS98014 99 
; GENERAL INFORMATION: 

APPLICANT: Pangaea, Inc. 

TITLE OF INVENTION: MICROPARTICLES FOR DELIVERY 
TITLE OF INVENTION: OF NUCLEIC ACID 
NUMBER OF SEQUENCES: 107 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Fish & Richardson, P.C. 

STREET: 225 Franklin Street 

CITY: Boston 

STATE : MA 

COUNTRY : US 

ZIP: 02110-2804 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette 

COMPUTER: IBM Compatible 

OPERATING SYSTEM: Windows 9 5 

SOFTWARE: FastSEQ for Windows Version 2.0 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US98/01499 

FILING DATE: 22-JAN-1998 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/787,547 

FILING DATE: 22-JAN-1997 
ATTORNEY /AGENT INFORMATION: 

NAME: Fraser, Janis K. 

REGISTRATION NUMBER: 34,819 

REFERENCE/DOCKET NUMBER: 08191/003WO1 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: 617-542-5070 

TELEFAX: 617-542-8906 

TELEX: 200154 
INFORMATION FOR SEQ ID NO: 49: 
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SEQUENCE CHARACTERISTICS: 
LENGTH: 9 amino acids 
TYPE: amino acid 
TOPOLOGY: linear 

MOLECULE TYPE: peptide 
PCT-US98-01499-4 9 


Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 11 
PCT-US99-2034 4-16 

; Sequence 16, Application PC/TUS9920344 
; GENERAL INFORMATION: 

APPLICANT: Ludwig Institute for Cancer Research 

TITLE OF INVENTION: AN ANTIGENIC PEPTIDE ENCODED BY AN ALTERNATIVE OPEN READING FRA 
; TITLE OF INVENTION: HUMAN MACROPHAGE COLONY-STIMULATING FACTOR 
; FILE REFERENCE: L0461/7040WO 
; CURRENT APPLICATION NUMBER: PCT/US99/20344 
; CURRENT FILING DATE: 1999-09-03 
; NUMBER OF SEQ ID NOS : 51 

SOFTWARE: FastSEQ for Window Version 3.0 
; SEQ ID NO 16 
LENGTH: 9 
TYPE: PRT 

ORGANISM: Homo sapiens 
PCT-US99-20344-16 


Query Match 100.0%; Score 52; DB 1; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 12 
US-07-926-666-27 

; Sequence 27, Application US/07926666 
GENERAL INFORMATION: 

APPLICANT: KUDO, RALPH T 
APPLICANT: GREY, HOWARD M 
APPLICANT: SETTE, ALESSANDRO 
APPLICANT: CELIS, ESTEBAN 

TITLE OF INVENTION: HLA BINDING PEPTIDES AND THEIR USES 
NUMBER OF SEQUENCES: 52 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: TOWNSEND AND TOWNSEND KHOURIE AND CREW 

STREET: 1 MARKET PLAZA, STEUART TOWER, SUITE 2000 

CITY: SAN FRANCISCO 

STATE : CA 

COUNTRY : USA 

ZIP: 94105 
COMPUTER READABLE FORM: 
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MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS /MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/07/926,666 

FILING DATE: 19920807 

CLASSIFICATION: 4 24 
ATTORNEY /AGENT INFORMATION: 

NAME: BAST IAN, KEVIN L 

REGISTRATION NUMBER: 34,774 

REFERENCE/DOCKET NUMBER: 14137-50 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: 415-543-9600 

TELEFAX: 415-543-5043 
; INFORMATION FOR SEQ ID NO: 27: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 9 amino acids 

TYPE: AMINO ACID 

TOPOLOGY: linear 
MOLECULE TYPE: peptide 
US-07-926-666-27 


Query Match 100.0%; Score 52; DB 9; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 13 
US-08-027-746-49 

; Sequence 49, Application US/08027746 
; GENERAL INFORMATION: 

APPLICANT: KUBO, Ralph T. 

APPLICANT: GREY, Howard M. 

APPLICANT: SETTE, Alessandro 

APPLICANT: CELIS, Esteban 

TITLE OF INVENTION: HLA BINDING PEPTIDES AND THEIR USES 
NUMBER OF SEQUENCES: 24 9 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: Townsend and Townsend Khourie and Crew 

; STREET: Steuart Street Tower, One Market Plaza 

CITY: San Francisco 
; STATE: California 

COUNTRY : US 

ZIP: 94105-1492 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC -DOS /MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/027,746 

FILING DATE: 19930305 

CLASSIFICATION: 530 
ATTORNEY /AGENT INFORMATION: 
; NAME: Bastian, Kevin L. 

REGISTRATION NUMBER : 34,774 
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REFERENCE/DOCKET NUMBER: 14137-50-1 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 543-9600 
TELEFAX: (415) 543-5043 
INFORMATION FOR SEQ ID NO: 49: 
SEQUENCE CHARACTERISTICS: 
LENGTH : 9 amino acids 
TYPE: AMINO ACID 
TOPOLOGY: linear 
MOLECULE TYPE: peptide 
ORIGINAL SOURCE: 
; ORGANISM: Homo sapiens 

US-08-027-746-49 

Query Match 100.0%; Score 52; DB 10; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 14 
US-08-103-396A-54 

Sequence 54, Application US/08103396A 
GENERAL INFORMATION: 

APPLICANT: KUBO, Ralph T. 
APPLICANT: GREY, Howard M. 
APPLICANT: SETTE, Alessandro 
APPLICANT: CELIS, Esteban 

TITLE OF INVENTION: HLA BINDING PEPTIDES AND THEIR USES 
NUMBER OF SEQUENCES : 662 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Townsend and Townsend Khourie and Crew 
STREET: Steuart Street Tower, One Market Plaza 
CITY: San Francisco 
STATE: California 
COUNTRY : US 
ZIP: 94105-1492 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/103, 396A 
FILING DATE: 06-AUG-1993 
CLASSIFICATION: 424 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/926,666 
FILING DATE: 07-JUL-1992 
CLASSIFICATION: 424 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/027,746 
FILING DATE: 05-MAR-1993 
CLASSIFICATION: 424 
ATTORNEY/AGENT INFORMATION: 
NAME: Bastian, Kevin L. 
REGISTRATION NUMBER: 34,774 
REFERENCE /DOCKET NUMBER: 14137-50-2 
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TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 543-9600 
TELEFAX: (415) 543-5043 
INFORMATION FOR SEQ ID NO: 54: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 9 amino acids 
; TYPE: amino acid 

TOPOLOGY: linear 
MOLECULE TYPE: peptide 
ORIGINAL SOURCE: 

ORGANISM: Homo sapiens 
US-08-103-396A-54 


Query Match 100.0%; Score 52; DB 11; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

II II I I I I I 
Db 1 EADPTGHSY 9 


RESULT 15 

US-08-103-396A-549 

Sequence 549, Application US/08103396A 
GENERAL INFORMATION: 

APPLICANT: KUBO, Ralph T. 
APPLICANT: GREY, Howard M. 
APPLICANT: SETTE, Alessandro 
APPLICANT: CELIS, Esteban 

TITLE OF INVENTION: HLA BINDING PEPTIDES AND THEIR USES 
NUMBER OF SEQUENCES: 662 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Townsend and Townsend Khourie and Crew 
STREET: Steuart Street Tower, One Market Plaza 
CITY: San Francisco 
STATE: California 
COUNTRY : US 
ZIP: 94105-1492 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/103, 396A 
FILING DATE: 06-AUG-1993 
CLASSIFICATION: 424 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/926,666 
FILING DATE: 07-JUL-1992 
CLASSI FICATION : 42 4 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/027,746 
FILING DATE: 05-MAR-1993 
CLASSIFICATION: 424 
ATTORNEY/AGENT INFORMATION: 
NAME: Bastian, Kevin L. 
REGISTRATION NUMBER: 34,774 
REFERENCE/DOCKET NUMBER: 14137-50-2 
TELECOMMUNICATION INFORMATION: 
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TELEPHONE: (415) 543-9600 

TELEFAX: (415) 543-5043 
; INFORMATION FOR SEQ ID NO: 54 9: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 9 amino acids 

; TYPE: amino acid 

STRANDEDNESS : unknown 
; TOPOLOGY: unknown 

MOLECULE TYPE: peptide 
US-08-103-396A-549 

Query Match 100.0%; Score 52; DB 11; Length 9; 

Best Local Similarity 100.0%; Pred. No. 7.7e+06; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

MINIMI 
Db 1 EADPTGHSY 9 


Search completed: August 25, 2006, 01:11:18 
Job time : 605 sees 


SCORE 1.3 BuildDate: 12/06/2005 
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SCORE Search Results Details for Application 
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26-rapn, 


Score Home Retrieve Application SCORE System 
Page List Overview 


SCORE 
FAQ 


Comments / 
Suggestions 


This page gives you Search Results detail for the Application 08819669 and Search Result us-08- 

819-669e-26.rapn. 

start 

Go Back to previous pa g 

GenCore version 5.1.9 
Copyright (c) 1993 - 2006 Bioccelera tion Ltd. 

OM protein - protein search, using sw model 


Run on: 


Title: 

Perfect score: 
Sequence : 


August 25, 2006, 01:01:22 ; Search time 40 Seconds 

(without alignments) 
19.416 Million cell updates/sec 

US-08-819-669E-26 
52 

1 EADPTGHSY 9 


Scoring table: BLOSUM62 

Gapop 10.0 , Gapext 0.5 

Searched: 361526 seqs, 86294087 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 


361526 


Database 


Pending_Patents_ 

1: /EMC_Celerra] 

2 : /EMC_Celerra~ 

3: /EMC_Celerra~ 

4 : /EMC_Celerra~ 

5: /EMC_Celerra_ 

6: /EMC_Celerra_ 

7: /EMC_Celerra~ 

8: /EMC Celerra 


_AA_New:* 
SIDS3/ptodata/l/paa 
SIDS3/ptodata/l/paa 
SIDS3/ptodata/l/paa 
SIDS3/ptodata/l/paa 
_SIDS3/ptodata/l/paa 
_SIDS3/ptodata/l/paa 
_SIDS3/ptodata/l/paa 
_SIDS3/ptodata/l/paa 


/PCT_NEW_COMB . pep : * 
/US 0 6_NEW_COMB . pep : * 
/US07_NEW_COMB . pep : * 
/US08_NEW_COMB . pep : * 
/US09_NEW_COMB.pep: * 
/US10_NEW_COMB . pep : * 
/US 1 l_NEW_COMB . pep : * 
/US60__NEW_COMB . pep : * 


Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 


Result 


Query 
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No . 

Score 

Match 

Length 

DB 

ID 

Description 

1 

52 

100. 

0 

9 

6 

US-lU-obz- /IbA-U 

Sequence 

13, Appl 

2 

52 

100. 

0 

y 

b 

t to in ^ on noo7\ /i 

Sequence 

4, Appli 

3 

52 

100 

0 

9 

6 

T TO in /l/l*7 1 C "1 7\ Q 

US-1U-44 /-IblA-y 

Sequence 

9, Appli 

4 

52 

100 

0 

9 

7 

TTC 11 O "7 C O O ^ 7\ O 

US -11-3 tD-ZZ oA- o 

Sequence 

3, Appli 

5 

52 

100 

0 

309 

6 

tin in noo7\ n 
US-lU-bb f-vZZA- / 1 

Sequence 

71, Appl 

6 

52 

100 

0 

445 

5 

up nn cni c^cr\ ~7 

US-09-601-bobD- / 

Sequence 

7, Appli 

7 

52 

100 

0 

44 6 

5 

US-Uy-bUl-OboD-fl 

Sequence 

4, Appli 

8 

52 

100 

0 

1342 

6 

Tin i /"\ * m An o ti i a 

US- 10-4 97 -08 8 A- 14 

Sequence 

14, Appl 

9 

44 

84 

6 

369 

7 

US -11-371-354-7336/ 

Sequence 

73367, A 

10 

4 3 

82 

7 

315 

7 

it|-i Oil OC/l cni Ql 

US -Il-371-ib4-b919 / 

Sequence 

69197, A 

11 

43 

82 

7 

318 

7 

US-11-371-354-71659 

Sequence 

71659, A 

12 

42 

80 

8 

319 

7 

T T <~» -1-1 O "7 1 TOO^I 

US- 11-371- 3 b4 - /3 34 1 

Sequence 

73341, A 

13 

37 

71 

2 

1049 

6 

tin in a c c\ non o tz c\ 

US- 10- 6 69 -920 -860 

Sequence 

860, App 

14 

36 

69 

2 

9 

6 

T TP in OCO "7 1 C 7\ i o 

US-lU-obZ- /IbA-lZ 

Sequence 

12, Appl 

15 

36 

69 

2 

10 

6 

US-10-362-715A-23 

Sequence 

23, Appl 

16 

3 6 

69 

2 

10 

6 

US-10-44 f ~ IblA-Zo 

Sequence 

25, Appl 

17 

36 

69 

2 

314 

6 

nri in ^C*7 AOOTl "7 O 

US- 1U- bb /-UzZA- / o 

Sequence 

73, Appl 

18 

36 

69 

2 

314 

7 

Tin 11 /I O /"» TO /I O 

US- 11-4 39- 334 -2 

Sequence 

2, Appli 

19 

36 

69 

2 

314 

7 

US-11-371-354-69501 

Sequence 

69501, A 

20 

36 

69 

2 

372 

6 

Tin i /"\ riA ri r n OO 

US-10-510-953-38 

Sequence 

38, Appl 

21 

36 

69 

.2 

389 

7 

tt(-« -1-1 A A *~~\ s~ /~ n 

US-11-442-668-23 

Sequence 

23, Appl 

22 

36 

69 

.2 

403 

5 

US-09-601-565D-b 

Sequence 

5, Appli 

23 

36 

69 

.2 

428 

6 

US- 10-553-674-53 

Sequence 

53, Appl 

24 

36 

69 

.2 

450 

5 

US-09-601-565D-2 

Sequence 

2, Appli 

25 

36 

69 

.2 

453 

5 

US-09-601-565D-9 

Sequence 

9, Appli 

26 

36 

69 

.2 

599 

7 

US-11-442-668-59 

Sequence 

59, Appl 

27 

35 

67 

.3 

346 

7 

US-11-371-354-1274 0 

Sequence 

12740, A 

28 

35 

67 

.3 

346 

7 

US-11-371-354-65581 

Sequence 

65581, A 

29 

35 

67 

.3 

346 

7 

US- 11-37 1-354 -7 68 18 

Sequence 

76818, A 

30 

35 

67 

.3 

359 

. 1 

PCT-US06-18535-8064 

Sequence 

8064, Ap 

31 

35 

67 

.3 

359 

7 

t m 11 /lOI n r r o A T /I 

US-11-431-855-8064 

Sequence 

8064, Ap 

32 

35 

67 

.3 

561 

8 

US- 60-836-98 6-308 81 

Sequence 

30881, A 

33 

35 

67 

.3 

734 

7 

US-11-431-708-2503 

Sequence 

2503, Ap 

34 

35 

67 

.3 

734 

7 

i T n i-i AT r A/^O /-"-IOC 

US-11-475-062-6125 

Sequence 

6125, Ap 

35 

35 

67 

.3 

734 

8 

US- 60-812-075-13 

Sequence 

13, Appl 

36 

35 

67 

.3 

873 

7 

US-11-431-708-2258 

Sequence 

2258, Ap 

37 

35 

67 

.3 

873 

7 

US-11-475-062-3172 

Sequence 

3172, Ap 

38 

35 

67 

.3 

873 

8 

tt" /* n oi n c\ a r\ ~7n 

US-60-819-940-70 

Sequence 

70, Appl 

39 

35 

67 

.3 

873 

8 

US- 60-812-075-14 

Sequence 

14, Appl 

40 

35 

67 

.3 

925 

7 

xifi 11 /I O 1 *7 n o OOCQ 

US -11-431-708-2259 

Sequence 

2259, Ap 

4 1 

35 

67 

.3 

Ci 1 c 

92 b 

/ 

no ii /1TC nCO OTTO 

Sequence 

3173, Ap 

42 

35 

67 

.3 

925 

8 

US-60-812-075-15 

Sequence 

15, Appl 

43 

35 

67 

.3 

931 

7 

US-11-431-708-2261 

Sequence 

2261, Ap 

44. 

35 

67 

.3 

931 

7 

US-11-475-062-3175 

Sequence 

3175, Ap 

45 

35 

67 

.3 

931 

8 

US-60-812-075-16 

Sequence 

16, Appl 


ALIGNMENTS 


RESULT 1 

US-10-362-715A-13 

; Sequence 13, Application US/10362715A 

; GENERAL INFORMATION: 

; APPLICANT: Schuler, Gerold 

/ APPLICANT: Schuler-Thurner , Beatrice 

TITLE OF INVENTION: METHOD FOR READY-TO-USE, ANTIGEN LOADED OR UNLOADED, 
TITLE OF INVENTION: CRYOCONSERVED MATURE DENDRITIC CELLS 

; FILE REFERENCE: ARG015 
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; CURRENT APPLICATION NUMBER: US/10/362 , 715A 

; CURRENT FILING DATE: 2003-06-25 

; PRIOR APPLICATION NUMBER : PCT/EP01/097 90 

; PRIOR FILING DATE: 2001-08-24 

; PRIOR APPLICATION NUMBER: DE 10041515.6 

; PRIOR FILING DATE: 2000-08-24 

; NUMBER OF SEQ ID NOS : 27 

; SOFTWARE: Patentln version 3.3 

; SEQ ID NO 13 

LENGTH : 9 

TYPE : PRT 

ORGANISM: Homo sapiens 
US-10-362-715A-13 

Query Match 100.0%; Score 52; DB 6; Length 9; 

Best Local Similarity 100.0%; Pred. No. 3.2e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 2 

US-10-497-088A-4 

; Sequence 4, Application US/10497088A 

; GENERAL INFORMATION: 

; APPLICANT: Germeraad, Wilfred 

; APPLICANT: Logtenberg, Ton 

; APPLICANT: Lekker kerker , Annemarie N 

TITLE OF INVENTION: Antigen presenting cell targeting conjugate, an antigen 
TITLE OF INVENTION: presenting cell contacted with such conjugate, their use 
TITLE OF INVENTION: for vaccination or as medicament, and methods for their 
TITLE OF INVENTION: production or generation 

; FILE REFERENCE: 0070 US 00 CON 

; CURRENT APPLICATION NUMBER: US/10/4 97, 088A 

; CURRENT FILING DATE: 2005-06-20 

; NUMBER OF SEQ ID NOS: 20 

SOFTWARE: Patentln version 3.2 

; SEQ ID NO 4 
LENGTH: 9 
TYPE: PRT 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: MAGE- 1 . Al specific peptide 
US-10-497-088A-4 

Query Match 100.0%; Score 52; DB 6; Length 9; 

Best Local Similarity 100.0%; Pred. No. 3.2e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 1 EADPTGHSY 9 


RESULT 3 

US-10-447-161A-9 

; Sequence 9, Application US/10447161A 

; GENERAL INFORMATION: 

; APPLICANT: Wang, Rong Fu 
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; TITLE OF INVENTION: MUTANT FIBRONECTIN AND TUMOR METASTASIS 
; FILE REFERENCE: HO-P02484US1 

; CURRENT APPLICATION NUMBER: US/10/447 , 161A 

; CURRENT FILING DATE: 2003-05-28 

; PRIOR APPLICATION NUMBER: US 60/383,530 

; PRIOR FILING DATE: 2002-05-28 

; NUMBER OF SEQ ID NOS : 157 

SOFTWARE: Patentln version 3.3 
; SEQ ID NO 9 

LENGTH: 9 

TYPE: PRT 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Synthetic Peptide 
US-10-447-161A-9 

Query Match 100.0%; Score 52/ DB 6; Length 9; 

Best Local Similarity 100.0%; Pred. No. 3.2e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 

Db 1 EADPTGHSY 9 


RESULT 4 

US-11-375-226A-3 

; Sequence 3, Application US/11375226A 

; GENERAL INFORMATION: 

; APPLICANT: Yang, Yuh-Cheng 

APPLICANT: Tsao, Yeou-Ping 
; APPLICANT: Chen, Show-Li 

; TITLE OF INVENTION: A PEPTIDE ANTIGEN OF HUMAN PAPILLOMAVIRUS TYPE 16 AND APPLICATI 
; TITLE OF INVENTION: THEREOF 
; FILE REFERENCE: 943371-IE1 

; CURRENT APPLICATION NUMBER: US/11/37 5 , 22 6A 
; CURRENT FILING DATE: 2006-03-14 
; NUMBER OF SEQ ID NOS: 3 

SOFTWARE: Patentln version 3.2 
; SEQ ID NO 3 

LENGTH: 9 

TYPE: PRT 

ORGANISM: artificial 
FEATURE : 

OTHER INFORMATION: melanoma antigen-1 peptide 161-169 (negative control) 
US-11-375-226A-3 

Query Match 100.0%; Score 52; DB 7; Length 9; 

Best Local Similarity 100.0%; Pred. No. 3.2e+05; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I E I 
Db 1 EADPTGHSY 9 


RESULT 5 

US-10-657-022A-71 

; Sequence 71, Application US/10657022A 

; GENERAL INFORMATION: 

; APPLICANT: Simard, John J. L. 


http://es/ScoreAccessWeb^ 8/30/06 


; APPLICANT: Diamond, David C. 
; APPLICANT: Liu, Liping 
; APPLICANT: Liu, Zheng 

; TITLE OF INVENTION: EPITOPE SEQUENCES 
; FILE REFERENCE: MANNK.032A 

; CURRENT APPLICATION NUMBER: US/10/657 , 022A 

; CURRENT FILING DATE: 2003-09-05 

; PRIOR APPLICATION NUMBER : 60/409,123 

; PRIOR FILING DATE: 2002-09-06 

; NUMBER OF SEQ ID NOS : 690 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 71 

LENGTH: 309 

TYPE: PRT' 

ORGANISM: Homo sapiens 
US-10-657-022A-71 

Query Match 100.0%; Score 52; DB 6; Length 309; 

Best Local Similarity 100.0%; Pred. No. 0.035; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 161 EADPTGHSY 169 


RESULT 6 

US-09-601-565D-7 

; Sequence 7, Application US/09601565D 
; GENERAL INFORMATION: 

APPLICANT: Smith Kline Beecham Biologicals 
; TITLE OF INVENTION: Processes for the Production of Therapeutic Compositions 
; FILE REFERENCE: B45126 

; CURRENT APPLICATION NUMBER: US/09/601 , 5 65D 
; CURRENT FILING DATE: 2000-08-03 
; NUMBER OF SEQ ID NOS: 15 

SOFTWARE: Patentln version 3.3 
; SEQ ID NO 7 

LENGTH : 445 

TYPE: PRT 

ORGANISM: Artificial 
FEATURE : 

OTHER INFORMATION: Fusion protein of CLYTA-MAGEl-Histidine 
US-09-601-565D-7 

Query Match 100.0%; Score 52; DB 5; Length 445; 

Best Local Similarity 100.0%; Pred. No. 0.052; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 288 EADPTGHSY 2 96 


RESULT 7 

US-09-601-565D-4 

; Sequence 4, Application US/09601565D 
; GENERAL INFORMATION: 

APPLICANT: Smith Kline Beecham Biologicals 

TITLE OF INVENTION: Processes for the Production of Therapeutic Compositions 
FILE REFERENCE: B4 5126 
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; CURRENT APPLICATION NUMBER : US/09/601 , 565D 

; CURRENT FILING DATE: 2000-08-03 

; NUMBER OF SEQ ID NOS : 15 

; SOFTWARE: Patentln version 3.3 

; SEQ ID NO 4 

LENGTH: 446 

TYPE : PRT 

ORGANISM: Artificial 
FEATURE : 

OTHER INFORMATION: Fusion protein of LPD-MAGEl-Histidine 
US-09-601-565D-4 

Query Match 100.0%; Score 52; DB 5; Length 446; 

Best Local Similarity 100.0%; Pred. No. 0.052; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 289 EADPTGHSY 2 97 


RESULT 8 

US-10-497-088A-14 

; Sequence 14, Application US/104 97088A 

; GENERAL INFORMATION: 

; APPLICANT: Germeraad, Wilfred 

APPLICANT: Logtenberg, Ton 

APPLICANT: Lekker kerker , Annemarie N 

TITLE OF INVENTION: Antigen presenting cell targeting conjugate, an antigen 
TITLE OF INVENTION: presenting cell contacted with such conjugate, their use 
TITLE OF INVENTION: for vaccination or as medicament, and methods for their 
TITLE OF INVENTION: production or generation 
FILE REFERENCE: 0070 US 00 CON 

; CURRENT APPLICATION NUMBER: US/10/4 97 , 088A 

; CURRENT FILING DATE: 2005-06-20 

; NUMBER OF SEQ ID NOS: 20 

; SOFTWARE: Patentln version 3.2 

; SEQ ID NO 14 
LENGTH: 1342 
TYPE : PRT 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: MatDCl 6 -C gamma 4 -MAGE -Al 
FEATURE : 

NAME /KEY : MISC_FEATURE 

LOCATION: (836) .. (836) 
; OTHER INFORMATION: Unsure amino acid 
US-10-497-088A-14 

Query Match 100.0%; Score 52; DB 6; Length 1342; 

Best Local Similarity 100.0%; Pred. No. 0.17; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I I I 
Db 161 EADPTGHSY 169 


RESULT 9 

US-11-371-354-73367 

; Sequence 73367, Application US/11371354 
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; GENERAL INFORMATION: 

; APPLICANT: CARRINO, JOHN 

; APPLICANT: LIANG, FENG 

; TITLE OF INVENTION: COLLECTIONS OF MATCHED BIOLOGICAL REAGENTS AND METHODS FOR 

; TITLE OF INVENTION: IDENTIFYING MATCHED REAGENTS 

; FILE REFERENCE: INV-1005-UT2 

; CURRENT APPLICATION NUMBER: US/11/371,354 

; CURRENT FILING DATE: 2006-03-07 

; PRIOR APPLICATION NUMBER: 60/673,045 

; PRIOR FILING DATE: 2005-04-19 

; PRIOR APPLICATION NUMBER: 60/665,199 

; PRIOR FILING DATE: 2005-03-25 

; PRIOR APPLICATION NUMBER: 60/665,200 

; PRIOR FILING DATE: 2005-03-25 

; PRIOR APPLICATION NUMBER: 60/659,493 

; PRIOR FILING DATE: 2005-03-07 

; PRIOR APPLICATION NUMBER: 60/659,492 

; PRIOR FILING DATE: 2005-03-07 

; PRIOR APPLICATION NUMBER: 60/953,586 

PRIOR FILING DATE: 2005-02-15 

PRIOR APPLICATION NUMBER: 60/651,390 
; PRIOR FILING DATE: 2005-02-08 
; NUMBER OF SEQ ID NOS : 78682 
; SOFTWARE: Patentln version 3.3 
; SEQ ID NO 7 3367 
LENGTH: 3 69 
TYPE: PRT 
; ORGANISM: Homo sapiens 
US-11-371-354 -73367 

Query Match 84.6%; Score 44; DB 7; Length 369; 

Best Local Similarity 77.8%; Pred. No. 1.4; 

Matches 7; Conservative 1; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I Mill!: 
Db 193 EVDPTGHSF 201 


RESULT 10 

US-11-371-354-69197 

; Sequence 69197, Application US/11371354 

; GENERAL INFORMATION: 

; APPLICANT: CARRINO, JOHN 

; APPLICANT : LIANG, FENG 

; TITLE OF INVENTION: COLLECTIONS OF MATCHED BIOLOGICAL REAGENTS AND METHODS FOR 

; TITLE OF INVENTION: IDENTIFYING MATCHED REAGENTS 

; FILE REFERENCE: INV-1005-UT2 

; CURRENT APPLICATION NUMBER: US/11/371,354 

; CURRENT FILING DATE: 2006-03-07 

; PRIOR APPLICATION NUMBER: 60/673,045 

; PRIOR FILING DATE: 2005-04-19 

; PRIOR APPLICATION NUMBER: 60/665,199 

; PRIOR FILING DATE: 2005-03-25 

; PRIOR APPLICATION NUMBER: 60/665,200 

; PRIOR FILING DATE: 2005-03-25 

; PRIOR APPLICATION NUMBER: 60/659,493 

; PRIOR FILING DATE: 2005-03-07 

; PRIOR APPLICATION NUMBER: 60/659,492 

; PRIOR FILING DATE: 2005-03-07 

; PRIOR APPLICATION NUMBER: 60/953,586 
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; PRIOR FILING DATE: 2005-02-15 

; PRIOR APPLICATION NUMBER: 60/651,390 

; PRIOR FILING DATE: 2005-02-08 

; NUMBER OF SEQ ID NOS : 78682 

SOFTWARE: Patentln version 3.3 
; SEQ ID NO 69197 

LENGTH: 315 

TYPE: PRT 
/ ORGANISM: Homo sapiens 
US-11-371-354-69197 

Query Match 82.7%; Score 43; DB 7; Length 315; 

Best Local Similarity 77.8%; Pred. No. 1.9; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I II I I I I 
Db 167 EVDPAGHSY 175 


RESULT 11 

US-11-371-354-71659 

; Sequence 71659, Application US/11371354 

; GENERAL INFORMATION: 

; APPLICANT: CARRINO, JOHN 

; APPLICANT: LIANG, FENG 

TITLE OF INVENTION: COLLECTIONS OF MATCHED BIOLOGICAL REAGENTS AND METHODS FOR 
; TITLE OF INVENTION: IDENTIFYING MATCHED REAGENTS 

FILE REFERENCE: INV-1005-UT2 
; CURRENT APPLICATION NUMBER: US/11/371,354 
; CURRENT FILING DATE: 2006-03-07 

PRIOR APPLICATION NUMBER: 60/673,045 

PRIOR FILING DATE: 2005-04-19 

PRIOR APPLICATION NUMBER: 60/665,199 

PRIOR FILING DATE: 2005-03-25 

PRIOR APPLICATION NUMBER: 60/665,200 

PRIOR FILING DATE: 2005-03-25 

PRIOR APPLICATION NUMBER: 60/659,493 

PRIOR FILING DATE: 2005-03-07 

PRIOR APPLICATION NUMBER: 60/659,492 

PRIOR FILING DATE: 2005-03-07 

PRIOR APPLICATION NUMBER: 60/953,586 

PRIOR FILING DATE: 2005-02-15 

PRIOR APPLICATION NUMBER: 60/651,390 
; PRIOR FILING DATE: 2005-02-08 
; NUMBER OF SEQ ID NOS: 78682 

SOFTWARE: Patentln version 3.3 
; SEQ ID NO 71659 
LENGTH: 318 
TYPE : PRT 
; ORGANISM: Homo sapiens 
US-11-371-354-71659 

Query Match 82.7%; Score 43; DB 7; Length 318; 

Best Local Similarity 77.8%; Pred. No. 1.9; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I II I I I I 
Db 171 EVDPAGHSY 179 
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RESULT 12 

US-11-371-354-73341 

; Sequence 73341, Application US/11371354 

; GENERAL INFORMATION: 

; APPLICANT: CARRINO, JOHN 

/ APPLICANT: LIANG, FENG 

/ TITLE OF INVENTION: COLLECTIONS OF MATCHED BIOLOGICAL REAGENTS AND METHODS FOR 

; TITLE OF INVENTION: IDENTIFYING MATCHED REAGENTS 

; FILE REFERENCE: INV-1005-UT2 

; CURRENT APPLICATION NUMBER: US/11/371,354 

; CURRENT FILING DATE: 2006-03-07 

; PRIOR APPLICATION NUMBER: 60/673,045 

; PRIOR FILING DATE: 2005-04-19 

; PRIOR APPLICATION NUMBER: 60/665,199 

; PRIOR FILING DATE: 2005-03-25 

; PRIOR APPLICATION NUMBER: 60/665,200 

; PRIOR FILING DATE: 2005-03-25 

; PRIOR APPLICATION NUMBER: 60/659,493 

; PRIOR FILING DATE: 2005-03-07 

/ PRIOR APPLICATION NUMBER: 60/659,492 

; PRIOR FILING DATE: 2005-03-07 

; PRIOR APPLICATION NUMBER: 60/953,586 

; PRIOR FILING DATE: 2005-02-15 

; PRIOR APPLICATION NUMBER: 60/651,390 

; PRIOR FILING DATE: 2005-02-08 

; NUMBER OF SEQ ID NOS : 78682 

SOFTWARE: Patentln version 3.3 
; SEQ ID NO 7 3341 

LENGTH: 319 

TYPE: PRT 

ORGANISM: Homo sapiens 
US-11-371-354-73341 

Query Match 80.8%; Score 42; DB 7; Length 319; 

Best Local Similarity 77.8%; Pred. No. 2.9; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I III 111 
Db 171 EVDPTSHSY 179 


RESULT 13 
US-10-669-920-860 

; Sequence 860, Application US/10669920 

; GENERAL INFORMATION: 

; APPLICANT: Morris, David W. 

; APPLICANT: Malandro, Marc S. 

; TITLE OF INVENTION: NOVEL THERAPEUTIC TARGETS IN CANCER 

; FILE REFERENCE: 20366-066001 

; CURRENT APPLICATION NUMBER: US/10/669,920 

; CURRENT FILING DATE: 2003-09-23 

; PRIOR APPLICATION NUMBER: US 10/004,113 

; PRIOR FILING DATE: 2001-10-23 

; PRIOR APPLICATION NUMBER: US 10/052,482 

; PRIOR FILING DATE: 2001-11-08 

; PRIOR APPLICATION NUMBER: US 09/997,722 

; PRIOR FILING DATE: 2001-11-30 

; PRIOR APPLICATION NUMBER: US 10/034,650 

; PRIOR FILING DATE: 2001-12-20 
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; PRIOR APPLICATION NUMBER: US 10/085,117 

; PRIOR FILING DATE: 2002-02-27 

; PRIOR APPLICATION NUMBER: US 10/087,192 

; PRIOR FILING DATE: 2002-03-01 

; PRIOR APPLICATION NUMBER: US 10/322,281 

; PRIOR FILING DATE: 2002-12-17 

; PRIOR APPLICATION NUMBER: US 10/322,696 

; PRIOR FILING DATE: 2002-12-17 

; NUMBER OF SEQ ID NOS : 1441 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 8 60 

LENGTH: 104 9 

TYPE : PRT 
; ORGANISM: Mus mus cuius 
US-10-669-920-860 


Query Match 71.2%; Score 37; DB 6; Length 1049; 

Best Local Similarity 100.0%; Pred. No. 91; 

Matches 6; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 4 PTGHSY 9 

I I I I I I 

Db 52 PTGHSY 57 


RESULT 14 
US-10-362-715A-12 

; Sequence 12, Application US/10362715A 

; GENERAL INFORMATION: 

; APPLICANT: Schuler, Gerold 

APPLICANT: Schuler-Thurner , Beatrice 

TITLE OF INVENTION: METHOD FOR READY-TO-USE, ANTIGEN LOADED OR UNLOADED, 

TITLE OF INVENTION: CRYOCONSERVED MATURE DENDRITIC CELLS 

FILE REFERENCE: ARG015 
; CURRENT APPLICATION NUMBER: US/10/362 , 7 15A 
; CURRENT FILING DATE: 2003-06-25 
; PRIOR APPLICATION NUMBER: PCT/EP01/097 90 
; PRIOR FILING DATE: 2001-08-24 
; PRIOR APPLICATION NUMBER: DE 10041515.6 

PRIOR FILING DATE: 2000-08-24 
; NUMBER OF SEQ ID NOS: 27 

SOFTWARE: Patentln version 3.3 
; SEQ ID NO 12 
LENGTH: 9 
TYPE: PRT 
; ORGANISM: Homo sapiens 
US-10-362-715A-12 

Query Match 69.2%; Score 36; DB 6; Length 9; 

Best Local Similarity 66.7%; Pred. No. 3.2e+05; 

Matches 6; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I 
Db 1 EVDPIGHLY 9 


RESULT 15 
US-10-362-715A-23 

; Sequence 23, Application US/10362715A 
; GENERAL INFORMATION: 


http://es/ScoreAccessWeb/GetItem.action?AppId=088 1 9669&seqld=6095 1 3&ItemName=us. . . 8/30/06 


; APPLICANT: Schuler, Gerold 

; APPLICANT: Schuler-Thurner , Beatrice 

TITLE OF INVENTION: METHOD FOR READY-TO-USE, ANTIGEN LOADED OR UNLOADED, 
TITLE OF INVENTION: CRYOCONSERVED MATURE DENDRITIC CELLS 

; FILE REFERENCE: ARG015 

; CURRENT APPLICATION NUMBER: US/10/362 , 715A 

; CURRENT FILING DATE: 2003-06-25 

; PRIOR APPLICATION NUMBER: PCT/EP01/097 90 

; PRIOR FILING DATE: 2001-08-24 

; PRIOR APPLICATION NUMBER: DE 10041515.6 

; PRIOR FILING DATE: 2000-08-24 

; NUMBER OF SEQ ID NOS : 27 

; SOFTWARE: Patentln version 3.3 

; SEQ ID NO 23 

LENGTH: 10 

TYPE: PRT 

ORGANISM: Homo sapiens 
US-10-362-715A-23 

Query Match 69.2%; Score 36; DB 6; Length 10; 

Best Local Similarity 66.7%; Pred. No. 1; 

Matches 6; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I 
Db 2 EVDPIGHLY 10 


Search completed: August 25, 2006, 01:12:05 
Job time : 41 sees 


SCORE 1.3 BuildDate: 12/06/2005 
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Score Home Page Retrieve Application List SCORE System Overview SCORE FAQ Comments / Sugg 


This page gives you Search Results detail for the Application 08819669 and Search Result us-08-81 
start 


A;Cross-references: UNIPROT:Q10635; UNIPARC:UPI000013A7EA; GB:Z73902; GB:AL123456; NID 
Caulobacter crescentus C;Date: 20-Apr-2001 #sequence_revision 20-Apr-2001 #text_change 09-J 
White, O.; Salzberg, S.L; Shapiro, L; Venter, J.C.; Fraser, CM. Proc. Natl. Acad. Sci. U.S.A. 98, 4 
Query Match 67.3%; Score 35; DB 2; Length 385; Best Local Similarity 66.7%; Pred. No. 60; Mate 

GenCore version 5.1.9 
Copyright (c) 1993 - 2006 Biocceleration Ltd. 


OM protein - protein search, using sw model 
Run on: 


Title: 

Perfect score: 
Sequence : 

Scoring table: 


Searched: 


August 25, 2006, 00:54:42 ; Search time 39 Seconds 

(without alignments) 
22.204 Million cell updates/sec 

US-08-819-669E-26 
52 

1 EADPTGHSY 9 
BLOSUM62 

Gapop 10.0 , Gapext 0.5 
283416 seqs, 96216763 residues 


Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 


283416 


Database 


PIR_80:* 
pirl : * 
pir2 : * 
pir3 : * 
pir4 : * 


Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 


SUMMARIES 


Result 


% 

Query 


No. 

Score 

Match 

Length 

DB 

ID 

Description 

1 

52 

100.0 

280 

2 

JC2358 

melanoma antigen M 

2 

44 

84.6 

369 

2 

138659 

melanoma antigen M 

3 

43 

82.7 

234 

2 

138667 

melanoma antigen M 
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4 
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melanoma antigen M 
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42 
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melanoma antigen M 

6 
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hypothetical prote 
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8 

37 
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regulatory protein 

9 

36 
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2 
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138663 

melanoma antigen M 

10 
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69 . 
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314 
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melanoma antigen M 

11 

36 

69 . 

. 2 

314 
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JC2361 

melanoma antigen M 
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13 
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15 
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2 
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16 

35 
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2 
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hypothetical prote 

17 

35 

67 . 

. 3 
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2 
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sugar-binding prot 

18 

35 
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1 

A3 92 16 
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19 

35 
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2 
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20 
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hypothetical prote 
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2 
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S33938 

penton protein (II 

27 

34 

65 . 

. 4 

668 

2 

T18635 

hypothetical prote 
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2 
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hypothetical prote 

30 
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cartilage intermed 

31 
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DNA-directed DNA p 
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33 

33 

63 . 

. 5 

214 

2 

AH0308 

conserved hypothet 

34 

33 

63 , 

. 5 

246 

2 

T51967 

proteasome endopep 

35 

33 

63 , 

. 5 

288 

2 

A56279 

carbon-monoxide de 

36 

33 

63 , 

. 5 

295 

2 

C69180 

adhesion protein - 

37 

33 

63 , 

. 5 

299 

2 

H82907 

pseudouridine synt 

38 

33 

63 . 

. 5 

301 

2 

C71194 

hypothetical prote 
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G-box binding fact 
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2 

S32581 

lignin peroxidase 

41 

33 

63. 

.5 
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2 

C90059 

3-hydroxy-3-methyl 

42 

33 

63, 

.5 
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2 

T39751 

major facilitator 

43 

33 
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.5 
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1 
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33 

63, 

.5 

488 

1 
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45 

33 

63, 

.5 

597 

1 

S37849 

DNA intrastrand cr 


ALIGNMENTS 


RESULT 1 
JC2358 

melanoma antigen MAGE-1 - human 
C; Species: Homo sapiens (man) 

C;Date: 20-Feb-1995 #sequence_revision 20-Feb-1995 #text_change 18-Feb-2000 
C; Accession: JC2358 

R;Ding, M. ; Beck, R.J.; Keller, C.J.; Fenton, R.G. 

Biochem. Biophys . Res. Commun. 202, 549-555, 1994 

A; Title: Cloning and analysis of MAGE-1 -related genes. 

A; Reference number: JC2358; MUID: 94311935; PMID:8037761 

A;Accession: JC2358 

A; Molecule type: mRNA 

A; Residues: 1-280 

A/Cross-references : UNIPARC : UPI0000178982 
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A; Experimental source: melanoma cell line DM150 
C; Genetics : 
A; Gene: MAGE 

C; Super family : tumor associated protein MAGE 

F; 161-169/Region: HLA-A1 binding #status predicted 

Query Match 100.0%; Score 52; DB 2; Length 280; 

Best Local Similarity 100.0%; Pred. No. 0.024; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I II I II I I 
Db 161 EADPTGHSY 169 


RESULT 2 
138659 

melanoma antigen MAGE- 10 - human 
C; Species: Homo sapiens (man) 

C;Date: 07-Jun-1996 #sequence_revision 07-Jun-1996 #text_change 09-Jul-2004 
C;Accession: 138659 

R; De Plaen, E.; Arden, K. ; Traversari, C; Gaforio, J.J.; Szikora, J. P.; De Smet, C; 
Immunogenetics 40, 360-369, 1994 

A; Title: Structure, chromosomal localization, and expression of 12 genes of the MAGE f 
A;Reference number: 138659; MUID : 95012457 ; PMID:7927540 
A;Accession: 138659 

A; Status: preliminary; translated from GB/EMBL/DDBJ 
A; Molecule type: DNA 
A; Residues: 1-369 

A;Cross-references: UNIPROT : P43363; UNIPARC :UPI0000000C57 ; EMBL:U10685; NID:g533510; P 
C; Genetics : 

A; Gene: GDB : MAGEA1 0 ; MAGE 10 
A;Cross-references: GDB:331126 
A; Map position: Xq28-Xq28 
A;Introns: #status absent 

C; Super family : tumor associated protein MAGE 

Query Match 84.6%; Score 44; DB 2; Length 369; 

Best Local Similarity 77.8%; Pred. No. 1.1; 

Matches 7; Conservative 1; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I I : 
Db 193 EVDPTGHSF 201 


RESULT 3 
138667 

melanoma antigen MAGE -8 - human 
C; Species: Homo sapiens (man) 

C;Date: 07-Jun-1996 #sequence_revision 07-Jun-1996 #text_change 09-Jul-2004 
C;Accession: 138667 

R; De Plaen, E . ; Arden, K. ; Traversari, C; Gaforio, J.J.; Szikora, J. P.; De Smet, C; 
Immunogenetics 40, 360-369, 1994 

A; Title: Structure, chromosomal localization, and expression of 12 genes of the MAGE f 
A; Reference number: 138659; MUID : 95012457 ; PMID:7927540 
A;Accession: 138667 

A; Status: preliminary; translated from GB/EMBL/DDBJ 
A; Molecule type: DNA 
A; Residues: 1-234 

A; Cross-references: UNIPROT : P43361; UNIPARC : UPI00000335D6; EMBL:U10693; NID:g533525; P 


http://es/ScoreAccessWeb/GetItem.action? Appld=088 1 9669&seqld=6095 14&ItemName=us. . . 8/30/06 


C; Genetics : 

A; Gene: GDB : MAGEA8 ; MAGE 8 
A;Cross-references: GDB:331123 
A; Map position: Xq28-Xq28 
A; Introns : #status absent 

C; Super family : tumor associated protein MAGE 

Query Match 82.7%; Score 43; DB 2; Length 234; 

Best Local Similarity 77.8%; Pred. No. 1; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I II I I I I 
Db 171 EVDPAGHSY 179 


RESULT 4 
138668 

melanoma antigen MAGE- 9 - human 
C; Species: Homo sapiens (man) 

C;Date: 07-Jun-1996 #sequence_revision 07-Jun-1996 #text_change 09-Jul-2004 
C;Accession: 138668 

R; De Plaen, E.; Arden, K.; Traversari, C; Gaforio, J. J.; Szikora, J. P.; De Smet, C; 
Immunogenetics 40, 360-369, 1994 

A; Title: Structure, chromosomal localization, and expression of 12 genes of the MAGE f 
A;Reference number: 138659; MUID : 95012457 ; PMID:7927540 
A;Accession: 138668 

A; Status: preliminary; translated from GB/EMBL/DDB J 
A; Molecule type: DNA 
A; Residues: 1-315 

A;Cross-references: UNIPROT : P43362 ; UNIPARC :UPI000012EB2B; EMBL:U10694; NID:g533527; P 
C; Genetics : 

A; Gene: GDB : MAGEA9 ; MAGE 9 
A;Cross-references : GDB: 331125 
A; Map position: Xp21 . 3-Xp21 . 3 
A; Introns : #status absent 

C; Super family: tumor associated protein MAGE 

Query Match 82.7%; Score 43; DB 2; Length 315; 

Best Local Similarity 77.8%; Pred. No. 1.4; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I II I I I I 
Db 167 EVDPAGHSY 17 5 


RESULT 5 
138660 

melanoma antigen MAGE- 11 - human 
C; Species: Homo sapiens (man) 

C;Date: 07-Jun-1996 #sequence_revision 07-Jun-1996 #text_change 09-Jul-2004 
C;Accession: 138660 

R; De Plaen, E . ; Arden, K. ; Traversari, C; Gaforio, J.J.; Szikora, J. P.; De Smet, C; 
Immunogenetics 40, 360-369, 1994 

A; Title: Structure, chromosomal localization, and expression of 12 genes of the MAGE f 
A;Reference number: 138659; MUID : 95012457 ; PMID:7927540 
A;Accession: 138660 

A; Status: preliminary; translated from GB/EMBL/DDB J 
A; Molecule type: DNA 
A; Residues: 1-319 
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A;Cross-references: UNIPROT : P43364 ; UNIPARC : UPIOO000OOC62 ; EMBL:U10686; NID:g533512; P 
C; Genetics : 

A; Gene: GDB : MAGEA1 1 ; MAGE 11 
A;Cross-ref erences : GDB: 331128 
A; Map position: Xq28-Xq28 
A;Introns: #status absent 

C; Super family : tumor associated protein MAGE 

Query Match 80.8%; Score 42; DB 2; Length 319; 

Best Local Similarity 77.8%; Pred. No. 2.2; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I III III 
Db 171 EVDPTSHSY 179 


RESULT 6 
E72685 

hypothetical protein APE0901 - Aeropyrum pernix (strain Kl) 
C; Species: Aeropyrum pernix 

C;Date: 20-Aug-1999 #sequence_revision 20-Aug-1999 #text_change 09-Jul-2004 
C;Accession: E72685 

R;Kawarabayasi, Y.; Hino, Y.; Horikawa, H.; Yamazaki, S.; Haikawa, Y.; Jin-no, K . ; Tak 
DNA Res. 6, 83-101, 1999 

A; Title: Complete genome sequence of an aerobic hyper-thermophilic Crenarchaeon, Aerop 

A; Reference number: A72450; MUID : 99310339; PMID : 103829 66 

A;Accession: E72685 

A; Status: preliminary 

A; Molecule type: DNA 

A; Residues: 1-129 

A;Cross-references: UNIPROT : Q9YDL2 ; UNIPARC : UPI000005DD2A; DDBJ: AP000060; NID:g5104188 

A; Experimental source: strain Kl 

C; Genetics : 

A; Gene: APE0901 

C; Super family : Aeropyrum pernix hypothetical protein APE0901 

Query Match 73.1%; Score 38; DB 2; Length 129; 

Best Local Similarity 85.7%; Pred. No. 4.9; 

Matches 6; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 3 DPTGHSY 9 

IE I I I I 

Db 115 DPAGHSY 121 


RESULT 7 
H83287 

conserved hypothetical protein PA2875 [imported] - Pseudomonas aeruginosa (strain PAOl 
C; Species: Pseudomonas aeruginosa 

C;Date: 15-Sep-2000 #sequence_revision 15-Sep-2000 #text_change 09-Jul-2004 
C; Accession: H83287 

R;Stover, C.K.; Pham, X.Q.; Erwin, A.L.; Mizoguchi, S.D.; Warrener, P.; Hickey, M.J.; 
Nature 406, 959-964, 2000 

A; Title: Complete genome sequence of Pseudomonas aeruginosa PAOl, an opportunistic pat 

A;Reference number: A82950; MUID : 20437337 ; PMID : 10984043 

A; Accession: H8 3287 

A; Status: preliminary 

A; Molecule type: DNA 

A; Residues: 1-305 

A;Cross-references: UNIPROT :Q9HZX1; UNIPARC :UPI00000C5857; GB:AE004713; GB:AE004091; N 
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A; Experimental source: strain PAOl 

C; Genetics : 

A; Gene: PA287 5 

C; Super family: methanol dehydrogenase regulatory protein 

Query Match 73.1%; Score 38; DB 2; Length 305; 

Best Local Similarity 85.7%; Pred. No. 12; 

Matches 6; Conservative 1; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGH 7 

: I I I I E I 
Db 283 QADPTGH 289 


RESULT 8 
RGASWA 

regulatory protein wetA - Emericella nidulans 

C; Species: Emericella nidulans, Aspergillus nidulans 

C;Date: 31-Mar-1992 #sequence_revision 31-Mar-1992 #text_change 09-Jul-2004 

C;Accession: A39665 

R;Marshall, M.A. ; Timberlake, W.E. 

Mol. Cell. Biol. 11, 55-62, 1991 

A;Title: Aspergillus nidulans wetA activates spore-specific gene expression. 
A; Reference number: A39665; MUID: 91094871; PMID:1986246 
A;Accession: A39665 
A; Molecule type: DNA 
A; Residues: 1-555 

A;Cross-references: UNIPROT: P22022; UNIPARC : UPI0000138EF8 ; GB:M60528; GB:M35758; NID : g 
C;Comment: The products of the genes brlA, abaA, and wetA are required for activation 
C; Genetics : 
A; Gene : wetA 

C;Superfamily : regulatory protein wetA 
C;Keywords: transcription regulation 

Query Match 71.2%; Score 37; DB 1; Length 555; 

Best Local Similarity 87.5%; Pred. No. 37; 

Matches 7; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 EADPTGH S 8 

III I I I I 
Db 109 EADATGHS 116 


RESULT 9 
138663 

melanoma antigen MAGE -5 - human (fragments) 
C; Species: Homo sapiens (man) 

C;Date: 07-Jun-1996 #sequence_revision 18-Feb-2000 #text_change 09-Jul-2004 
C;Accession: 138663; 138664; PH1299; PH1300 

R; De Plaen, E.; Arden, K. ; Traversari, C; Gaforio, J.J.; Szikora, J. P.; De Smet, C; 
Immunogenetics 40, 360-369, 1994 

A; Title: Structure, chromosomal localization, and expression of 12 genes of the MAGE f 
A; Reference number: 138659; MUID: 95012457 ; PMID:7927540 
A;Accession: 138663 

A; Status: preliminary; translated from GB/EMBL/DDB J 
A; Molecule type: DNA 
A; Residues: 1-124 

A;Cross-references: UNIPROT : P43359; UNIPARC : UPI000012EB2A; EMBL:U10689; NID:g533518; P 
A; Experimental source: MAGE-5a antigen 
A;Accession: 138664 

A; Status: preliminary; translated from GB/EMBL/DDB J 
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Molecule type: DNA 
Residues: 1-124 

Cross-references: UNIPARC :UPI000012EB2A; EMBL:U10690; NID:g533520; PIDN: AAA68874 . 1; 
Experimental source: MAGE- 5b antigen 

Note: these sequences seem to be incomplete with respect to other members of the sup 
Traversari, C; van der Bruggen, P.; Luescher, I.F.; Lurquin, C; Chomez, P.; Van Pe 

Exp. Med. 176, 1453-1457, 1992 
Title: A nonapeptide encoded by human gene MAGE-1 is recognized on HLA-A1 by cytolyt 
Reference number: PH1294; MUID : 93018875; PMID:1402688 
Accession: PH1299 
Molecule type : DNA 
Residues: 125-133 

Cross-references: UNIPARC : UPI000004 2 533 
Experimental source: MAGE 5 protein 
Accession: PH1300 
Molecule type : DNA 
Residues: 125-133 

Cross-references : UNIPARC :UPI0000042533 
Experimental source: MAGE 51 protein 
Genetics : 

Gene: GDB : MAGEA5 ; MAGES 
Cross-references: GDB: 331120 
Map position: Xq28-Xq28 
Introns : #status absent 

Superfamily: tumor associated protein MAGE 

Query Match 69.2%; Score 36; DB 2; Length 133; 

Best Local Similarity 66.7%; Pred. No. 12; 

Matches 6; Conservative 2; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I II I : : I 
Db 125 EADPTSNTY 133 


RESULT 10 
JC2360 

melanoma antigen MAGE- 6 - human 

N;Alternate names: tumor-associated antigen, MAGE- 3b 
C; Species: Homo sapiens (man) 

C;Date: 20-Feb-1995 #sequence_revision 20-Feb-1995 #text_change 09-Jul-2004 

C;Accession: JC2360; PH1301; 138665; G01445 

R;Ding, M.; Beck, R.J.; Keller, C.J.; Fenton, R.G. 

Biochem. Biophys . Res. Commun. 202, 549-555, 1994 

A;Title: Cloning and analysis of MAGE-1 -related genes. 

A; Reference number: JC2358; MUID : 94311935; PMID: 8037761 

A;Accession: JC2360 

A;Molecule type: mRNA 

A; Residues: 1-314 

A;Cross-references : UNIPROT : P43360; UNIPARC :UPI000000D9B0 
A; Experimental source: melanoma cell line DM150 

R; Traversari, C; van der Bruggen, P.; Luescher, I.F.; Lurquin, C; Chomez, P.; Van Pe 
J. Exp. Med. 176, 1453-1457, 1992 

A; Title: A nonapeptide encoded by human gene MAGE-1 is recognized on HLA-A1 by cytolyt 
A;Reference number: PH1294; MUID : 93018875; PMID:1402688 
A; Accession: PH1301 
A;Molecule type: DNA 
A; Residues: 168-176 

A;Cross-references : UNIPARC :UPI0000042625 

R; De Plaen, E . ; Arden, K.; Traversari, C; Gaforio, J.J.; Szikora, J. P.; De Smet, C; 
Immunogenetics 40, 360-369, 1994 
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A; Title: Structure, chromosomal localization, and expression of 12 genes of the MAGE f 
A;Reference number: 138659; MUID: 95012 457; PMID:7927540 
A; Accession: 138665 

A; Status: preliminary; translated from GB/EMBL/DDBJ 
A; Molecule type: DNA 
A; Residues: 1-314 

A;Cross-references: UNIPARC : UPI000000D9B0 ; EMBL :U10691 ; NID:g533522; PIDN : AAA68875 . 1; 
R;Fenton, R.G . 

submitted to the EMBL Data Library, June 1994 
A; Reference number: G07126 
A; Accession: G014 4 5 

A; Status: preliminary; translated from GB/EMBL/DDBJ 
A; Molecule type : mRNA 
A; Residues: 1-314 

A;Cross-references: UNIPARC : UPI00000OD9BO ; EMBL:U10339; NID:g499121; PIDN:AAA19006. 1; 
C; Genetics : 

A; Gene: GDB : MAGEA6 ; MAGE 6 

A; Cross-references : GDB : 331121 

A; Map position: Xq28-Xq28 

A; Introns : #status absent 

C; Super family : tumor associated protein MAGE 

F; 168-17 6/Region : HLA-A1 binding #status predicted 

Query Match 69.2%; Score 36; DB 2; Length 314; 

Best Local Similarity 66.7%; Pred. No. 31; 

Matches 6; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I 
Db 168 EVDPIGHVY 176 


RESULT 11 
JC2361 

melanoma antigen MAGE -3 - human 
N;Alternate names: MAGE 3 protein 
C; Species: Homo sapiens (man) 

C;Date: 20-Feb-1995 #sequence_revision 20-Feb-1995 #text_change 09-Jul-2004 

C;Accession: JC2361; PH1296; 138438 

R;Ding, M. ; Beck, R.J.; Keller, C.J.; Fenton, R.G. 

Biochem. Biophys . Res. Commun. 202, 549-555, 1994 

A; Title: Cloning and analysis of MAGE-l-related genes. 

A; Reference number: JC2358; MUID : 94311935; PMID:8037761 

A;Accession: JC2361 

A; Molecule type: mRNA 

A; Residues: 1-314 

A;Cross-references: UNIPROT : P43357 ; UNIPARC :UPI0000062 194 
A; Experimental source: melanoma cell line DM150 

R; Traversari, C; van der Bruggen, P.; Luescher, I.F.; Lurquin, C; Chomez, P.; Van Pe 
J. Exp. Med. 176, 1453-1457, 1992 

A; Title: A nonapeptide encoded by human gene MAGE-1 is recognized on HLA-A1 by cytolyt 
A; Reference number: PH1294; MUID: 93018875; PMID: 1402688 
A; Accession: PH12 96 
A; Molecule type: DNA 
A; Residues : 168-176 

A;Cross-references: UNIPARC : UPI000002F152 

R;Gaugler, B.; Van den Eynde, B.; van der Bruggen, P.; Romero, P.; Gaforio, J.J.; De P 
J. Exp. Med. 179, 921-930, 1994 

A; Title: Human gene MAGE-3 codes for an antigen recognized on a melanoma by autologous 
A;Reference number: 138438; MUID : 94157413; PMID:8113684 
A; Accession: 1384 38 
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A; Status: preliminary; translated from GB/EMBL/DDB J 
A; Molecule type: DNA 
A; Residues: 1-314 

A;Cross-references: UNIPARC : UPI0000062194 ; EMBL:U03735; NID:g468825; PIDN: AAA17446 . 1; 

C; Genetics : 

A; Gene: MAGE -3 

C; Superf amily : tumor associated protein MAGE 

F; 168-176/Region: HLA-A1 binding #status predicted 

Query Match 69.2%; Score 36; DB 2; Length 314; 

Best Local Similarity 66.7%; Pred. No. 31; 

Matches 6; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I I 
Db 168 EVDPIGHLY 17 6 


RESULT 12 
T37672 

probable DNA repair protein - fission yeast (Schizosaccharomyces pombe) 
C; Species: Schizosaccharomyces pombe 

C;Date: 03-Dec-1999 #sequence_revision 03-Dec-1999 #text_change 09-Jul-2004 
CAccession: T37672 

R;McDougall, R.C.. ; Rajandream, M.A.; Barrell, B.G.; Davis, P.; Churcher, CM. 
submitted to the EMBL Data Library, October 1999 
A;Reference number: Z21736 
A; Accession: T37 672 

A; Status: preliminary; translated from GB/EMBL/DDB J 
A; Molecule type: DNA 
A; Residues: 1-1375 

A;Cross-references: UNIPROT : Q9UTL9; UNIPARC : UPI0000069886; EMBL : AL132 675; PIDN:CAB5968 
A; Experimental source: strain 972h-; cosmid cl44 
C; Genetics : 

A;Gene: SPDB : SPAC144 . 05 
A; Map position: 1 

A;Introns: 1108/1; 1196/3; 1263/2; 1277/1 
F; 1088-1135/Domain: RING finger homology 

Query Match 69.2%; Score 36; DB 2; Length 1375; 

Best Local Similarity 66.7%; Pred. No. 1.5e+02; 

Matches 6; Conservative 1; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I : I I I I I 
Db 810 ESDPTGDEY 818 


RESULT 13 
A42551 

genome polyprotein - dengue virus type 1 (strain Singapore S275/90) 

N; Contains: capsid protein; envelope protein; membrane protein; nonstructural protein 
C; Species: dengue virus type 1 

C;Date: 30-Sep-1993 #sequence_revision 30-Sep-1993 #text_change 31-Dec-2004 
C;Accession: A42551 

R;Fu, J.; Tan, B.H.; Yap, E.H.; Chan, Y.C.; Tan, Y.H. 
Virology 188, 953-958, 1992 

A;Title: Full-length cDNA sequence of dengue type 1 virus (Singapore strain S275/90) . 

A; Reference number: A42551; MUID: 92263809; PMID:1585663 

A; Accession: A42551 

A; Molecule type: genomic RNA 
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A; Residues: 1-3396 

A;Cross-references: UNIPROT : P33478 ; UNIPARC : UPI000002F845; GB:M87512 
C; Super family : hepatitis C virus genome polyprotein 

C; Keywords: ATP; capsid protein; envelope protein; glycoprotein; nonstructural protein 

F; 1-114/Product : capsid protein #status predicted 

F; 115-281/Product : membrane protein precursor #status predicted 

F; 115-204/Domain: nonterminal signal sequence #status predicted 

F; 205-281/Product : membrane protein #status predicted 

F; 2 67 -2 7 9 /Domain : transmembrane #status predicted 

F;282-774/Product : envelope protein #status predicted 

F; 753-769/Domain: transmembrane #status predicted 

F; 7 7 5-1 12 7 /Product : nonstructural protein NS1 #status predicted 

F;1128-1344/Product: nonstructural protein NS2a #status predicted 

F; 134 5-14 74 /Product : nonstructural protein NS2b #status predicted 

F;1475-2093/Product: nonstructural protein NS3 #status predicted 

F; 1668-1675/Region: nucleotide-binding motif A (P-loop) 

F; 1755-1760/Region: nucleotide-binding motif B 

F;1759-1762/Region: DEAH motif 

F;2094-2243/Product : nonstructural protein NS4a #status predicted 

F;2244-2492/Product : nonstructural protein NS4b #status predicted 

F; 2493-3396/ Product : nonstructural protein NS5 #status predicted 

F; 183, 347 , 433/Binding site: carbohydrate (Asn) (covalent) #status predicted 

Query Match 69.2%; Score 36; DB 1; Length 3396; 

Best .Local Similarity 75.0%; Pred. No. 4e+02; 

Matches 6; Conservative 1; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 EADPTGHS 8 

I : I I III 
Db 3383 ESDPKGHS 3390 


RESULT 14 
F70769 

hypothetical protein Rvl322 - Mycobacterium tuberculosis (strain H37RV) 
C; Species: Mycobacterium tuberculosis 

C;Date: 17-Jul-1998 #sequence_revision 17-Jul-1998 #text_change 09-Jul-2004 
C; Accession: F707 69 

R;Cole, S.T.; Brosch, R . ; Parkhill, J.; Gamier, T . ; Churcher, C; Harris, D . ; Gordon, 
Nature 393, 537-544, 1998 

A;Authors: Sqares, R. ; Sulston, J.E.; Taylor, K. ; Whitehead, S.; Barrell, B.G. 

A; Title: Deciphering the biology of Mycobacterium tuberculosis from the complete genom 

A; Reference number: A70500; MUID: 98295987 ; PMID: 9634230 

A;Accession: F70769 

A; Status: preliminary; nucleic acid sequence not shown; translation not shown 
A; Molecule type: DNA 
A;Residues: 1-98 

1 
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SCORE Search Results Details for Application 
08819669 and Search Result us-08-819-669e- 
26,rup. 


Score Home Retrieve Application SCORE System SCORE Comments / 

Page List Overview FAQ Suggestions 

This page gives you Search Results detail for the Application 08819669 and Search Result us-08- 

819-669e-26.rup. 

start 

Go Back to previous page 

GenCore version 5.1.9 
Copyright (c) 1993 - 2006 Biocceleration Ltd. 

OM protein - protein search, using sw model 

Run on: August 25, 2006, 00:51:11 ; Search time 299 Seconds 

(without alignments) 
27.843 Million cell updates/sec 

Title: US-08-819-669E-2 6 

Perfect score: 52 

Sequence: 1 EADPTGHSY 9 

Scoring table: BLOSUM62 

Gapop 10.0 , Gapext 0.5 

Searched: 2849598 seqs, 925015592 residues 

Total number of hits satisfying chosen parameters: 2849598 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Database : UniProt_7 . 2 : * 

1: uniprot_sprot : * 
2: uniprot_trembl : * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 

% 

Result Query 

No. Score Match Length DB ID Description 


1 52 100.0 

2 44 84.6 

3 43 82.7 

4 43 82.7 


309 1 MAG Al _HUMAN 

369 1 MAGAA_HUMAN 

234 1 MAGA8 _HUMAN 

315 1 MAGA9 HUMAN 


P4 3 355 homo sapien 
P43363 homo sapien 
P43361 homo sapien 
P43362 homo sapien 
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5 

A *!J 

4 3 

82 . 

. 7 

315 

2 

AT 7 C TIT nur7V XT 

Q/ZOK4 HUMAN 

Q / Z0K4 

homo sapien 

6 

43 

82 , 

. 7 

318 

2 

Q 9 BUN 9_HUMAN 

Q9bun9 

homo sapien 

7 

42 

80 . 

. 8 

319 

1 

X JTT\ /"* T\ n TTTTXjrT\XT 

MAGAB HUMAN 

P4 3364 

homo sapien 

8 

42 

80 , 

. 8 

394 

2 

/~\ /* fjr» r? C TTT TXjTTV XT 

Q6ZRZ5_HUMAN 

Q6zr z5 

homo sapien 

9 

42 

80 , 

. 8 

429 

2 

/-iCnmTT^ ttttxjttaxt 

Q5ETU4 HUMAN 

Q5etu4 

homo sapien 

10 

40 

76 . 

. 9 

259 

1 

PYRK_BACAN 

Q81wf 3 

bacillus an 

11 

40 

76 , 

. 9 

259 

1 

PYRK_BACCR 

Q819S4 

bacillus ce 

12 

40 

76 , 

. 9 

259 

2 

Q3ENC9 BACTI 

Q3enc9 

bacillus tn 

13 

40 

7 6 . 

. 9 

1 C Ci. 

259 

2 

BACCE 


bacillus ce 

14 

40 

IS. 

. 9 

o c 

259 

2 

Q63 6E1 BACCZ 

/*\ £T O £L « 1 

Qbobel 

bacillus ce 

15 

40 

IS. 

. 9 

259 

2 

Q6HES 9_BACHK 

Q6hes9 

bacillus tn 

16 

40 

7 6 , 

. 9 

o c o 

259 

2 

BACC1 

r\i o o /I 
Q / 

bacillus ce 

17 

40 

76 , 

. 9 

5094 

2 

Q2IZL4 RHOPA 

Q21Z14 

rhodopseudo 

18 

39 

75 , 

. 0 

652 

2 

Q7SDF4 NEUCR 

Q7sdf 4 

neurospora 

19 

39 

75 . 

. 0 

1429 

2 

Q6CH67 YARLI 

Q6ch67 

yarrowia li 

20 

38 

73 , 

. 1 

129 

2 

Q9YDL2 AERPE 

Aft, » J 1 O 

Q9yal2 

aeropyrum p 

21 

38 

73 , 

. 1 

130 

2 

Q825J6 STRAW 

AO O C -i *T 

Q82 5 j 6 

streptomyce 

22 

38 

73 . 

. 1 

294 

2 

Q40M9 6_DESAC 

Q40m96 

desulf uromo 

23 

38 

73 , 

. 1 

305 

2 

Q9HZX1 PSEAE 

Q9hzxl 

pseudomonas 

24 

38 

73 . 

. 1 

337 

2 

Q4HXP0 GIBZE 

Q4nxp0 

gibberella 

25 

38 

73 , 

. 1 

34 6 

2 

Q7RXH4_NEUCR 

Q7rxh4 

neurospora 

26 

38 

73 . 

. 1 

355 

2 

Q4 7 5K8_RALE J 

a yi T r i,o 

Q47 oka 

ralstonia e 

27 

38 

73 . 

. 1 

356 

2 

Q4 3QJ8_SOLUS 

Q43qj 8 

solibacter 

28 

38 

73 . 

. 1 

1001 

2 

Q4PBD5_USTMA 

Q4pbd5 

ustilago ma 

29 

38 

73 , 

. 1 

1034 

2 

Q55XT8 CRYNE 

Q55xt8 

cryptococcu 

30 

38 

73 . 

. 1 

1065 

2 

Q4 PC22_USTMA 

Q4pc22 

ustilago ma 

31 

38 

73 . 

. 1 

1085 

2 

Q755J0_ASHGO 

Q755 j 0 

ashbya goss 

32 

37 

71 , 

.2 

86 

2 

Q61989_MOUSE 

Q61989 

mus musculu 

33 

37 

71, 

.2 

125 

2 

Q4L989_STAHJ 

Q41989 

staphylococ 

34 

37 

71, 

.2 

247 

2 

Q67RX7_SYMTH 

Q67rx7 

symbiobacte 

35 

37 

71 , 

. 2 

249 

2 

Q5V7C7 HALMA 

Q5v7c7 

haloarcula 

36 

37 

71 , 

.2 

271 

2 

Q6MHS7_BDEBA 

Q6mhs7 

bdellovibri 

37 

37 

71 , 

. 2 

279 

2 

Q3W747_9ACTO 

Q3w7 4 7 

frankia sp. 

38 

37 

71 , 

. 2 

345 

2 

Q8 9L61_BRAJA 

Q89161 

bradyrhizob 

39 

37 

71 . 

. 2 

479 

2 

Q4NIV6_9MICC 

Q4niv6 

arthrobacte 

40 

37 

71 , 

. 2 

555 

1 

WETA_EMENI 

P22022 

emericella 

41 

37 

71 , 

. 2 

555 

2 

Q5BBZ 3_EMENI 

Q5bbz3 

aspergillus 

42 

37 

71. 

.2 

604 

2 

Q3U1F2_M0USE 

Q3ulf2 

mus musculu 

43 

37 

71. 

.2 

604 

2 

Q8BQ25_MOUSE 

Q8bq25 

mus musculu 

44 

37 

71. 

.2 

622 

1 

PFA3_NEUCR 

Q7s7c5 

neurospora 

45 

37 

71. 

.2 

642 

2 

Q3U0V9_MOUSE 

Q3u0v9 

mus musculu 


ALIGNMENTS 


RESULT 1 
MAGA1 _HUMAN 

ID MAGA1 _HUMAN STANDARD; PRT; 309 AA. 

AC P43355; 000346; 

DT 01-NOV-1995, integrated into UniProtKB/Swiss-Prot . 

DT 01-NOV-1995, sequence version 1. 

DT 07-FEB-2006, entry version 44. 

DE Melanoma-associated antigen 1 (MAGE-1 antigen) (Antigen MZ2-E) . 

GN Name=MAGEAl; Synonyms =MAGE1, MAGE 1 A; 

OS Homo sapiens (Human) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

OC Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; Hominidae; 

OC Homo . 

OX NCB I_T ax I D= 9 6 0 6 ; 

RN [1] 
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RP NUCLEOTIDE SEQUENCE. 

RX MEDLINE=92086861; PubMed=184 0703; 

RA van der Bruggen P. , Traversari C, Chomez P., Lurquin C, de Plaen E., 

RA van den Eynde B., Knuth A. , Boon T . ; 

RT "A gene encoding an antigen recognized by cytolytic T lymphocytes on a 

RT human melanoma . " ; 

RL Science 254:1643-1647(1991). 

RN [2] 

RP NUCLEOTIDE SEQUENCE. 

RC TISSUE=SJcin; 

RX MEDLINE=94311935; PubMed=80377 61 ; 

RA Ding M. , Beck R.J., Keller C.J., Fenton R.G.; 

RT "Cloning and analysis of MAGE-l-related genes."; 

RL Biochem. Biophys . Res. Commun. 202:54 9-555(1994). 

RN [3] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA] . 

RX MEDLINE=20314869; PubMed=108 54409 ; DOI=10 . 1101/gr . 10 . 6 . 758 ; 

RA Mallon A.-M., Platzer M. , Bate R., Gloeckner G . , Botcherby M.R.M., 

RA Nordsiek G., Strivens M.A., Kioschis P., Dangel A., Cunningham D., 

RA Straw R.N. A., Weston P., Gilbert M. , Fernando S., Goodall K., 

RA Hunter G., Greystrong J.S., Clarke D., Kimberley C, Goerdes M. , 

RA Blechschmidt K. , Rump A., Hinzmann B., Mundy C.R., Miller W., 

RA Poustka A., Herman G.E., Rhodes M. , Denny P., Rosenthal A., 

RA Brown S . D.M. ; 

RT "Comparative genome sequence analysis of the Bpa/Str region in mouse 

RT and man . " ; 

RL Genome Res. 10:758-775(2000). 

RN [4] 

RP NUCLEOTIDE SEQUENCE, AND VARIANT ALA- 32 . 

RA Chen H., Wang L., Mei M. , Qin L., Cong X., Xu J., Wei L . , Wang Y . , 

RA Chen W. ; 

RT "The polymorphism of MAGE-1 gene in Chinese people."; 

RL Submitted (SEP-2002) to the EMBL/GenBank/DDB J databases. 

RN [5] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE MRNA] , AND VARIANT ALA-32. 

RA Kalnine N., Chen X., Rolfs A., Halleck A., Hines L . , Eisenstein S., 

RA Koundinya M. , Raphael J., Moreira D., Kelley T., LaBaer J., Lin Y . , 

RA Phelan M. , Farmer A.; 

RT "Cloning of human full-length CDSs in BD Creator (TM) system donor 

RT vector . " ; 

RL Submitted (AUG-2003) to the EMBL/GenBank/DDB J databases. 

RN [6] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE MRNA] , AND VARIANT ALA-32. 

RC TISSUE=Skin; 

RX MEDLINE=22388257; PubMed=124 77 932 ; DOI=10 . 1073/pnas . 242603899 ; 

RA Strausberg R.L., Feingold E.A., Grouse L.H., Derge J.G., 

RA Klausner R.D., Collins F.S., Wagner L., Shenmen CM., Schuler G.D., 

RA Altschul S.F., Zeeberg B., Buetow K.H., Schaefer C.F., Bhat N.K., 

RA Hopkins R.F., Jordan H., Moore T., Max S.I., Wang J., Hsieh F., 

RA Diatchenko L., Marusina K. , Farmer A. A., Rubin G.M., Hong L., 

RA Stapleton M. , Soares M.B., Bonaldo M.F., Casavant T.L., Scheetz T.E., 

RA Brownstein M.J., Usdin T.B., Toshiyuki S., Carninci P., Prange C, 

RA Raha S.S., Loquellano N.A., Peters G.J., Abramson R.D., Mullahy S.J., 

RA Bosak S.A., McEwan P.J., McKernan K.J., Malek J. A., Gunaratne P.H., 

RA Richards S., Worley K.C., Hale S., Garcia A.M., Gay L.J., Hulyk S.W., 

RA Villalon D.K., Muzny D.M., Sodergren E.J., Lu X., Gibbs R.A., 

RA Fahey J., Helton E . , Ketteman M., Madan A., Rodrigues S., Sanchez A., 

RA Whiting M., Madan A., Young A.C., Shevchenko Y., Bouffard G.G., 

RA Blakesley R.W., Touchman J.W., Green E.D., Dickson M.C., 

RA Rodriguez A.C., Grimwood J., Schmutz J., Myers R.M., 

RA Butterfield Y.S.N. , Krzywinski M.I., Skalska U., Smailus D.E., 


http://es/ScoreAccessWeb/GetItem.action?AppId=08819669&seqId=609515&ItemNam 8/30/06 


RA Schnerch A., Schein J.E., Jones S.J.M., Marra M.A.; 

RT "Generation and initial analysis of more than 15, 000 full-length human 

RT and mouse cDNA sequences."; 

RL Proc. Natl. Acad. Sci. U.S.A. 99:16899-16903(2002). 

RN [7] 

RP MUTAGENESIS. 

RC TISSUE=Blood; 

RX MEDLINE=94157413; PubMed=8113684; DOI=10 . 1084/jem. 179 . 3 . 921; 

RA Gaugler B., van den Eynde B . , van der Bruggen P., Romero P., 

RA Gaforio J.J., de Plaen E . , Lethe B., Brasseur F. , Boon T.; 

RT "Human gene MAGE -3 codes for an antigen recognized on a melanoma by 

RT autologous cytolytic T lymphocytes."; 

RL J. Exp. Med. 179:921-930(1994). 

RN [8] 

RP SUBCELLULAR LOCATION. 

RX MEDLINE=95012905; PubMed=7927954; 

RA Schultz-Thater E., Juretic A., Dellabona P., Luscher U., Siegrist W., 

RA Harder F . , Heberer M., Zuber M., Spagnoli G.C.; 

RT "MAGE-1 gene product is a cytoplasmic protein."; 

RL Int. J. Cancer 59:435-439(1994). 

CC -!- FUNCTION: Not known, though may play a role in embryonal 
CC development and tumor transformation or aspects of tumor 

CC progression. Antigen recognized on a melanoma by autologous 

CC cytolytic T lymphocytes. 

CC -!- SUBCELLULAR LOCATION: Cytoplasm. 

CC -!- TISSUE SPECIFICITY: Expressed in many tumors of several types, 
CC such as melanoma, head and neck squamous cell carcinoma, lung 

CC carcinoma and breast carcinoma, but not in normal tissues except 

CC for testes. Never expressed in kidney tumors, leukemias and 

CC lymphomas . 

CC -!- SIMILARITY: Contains 1 MAGE domain. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; M77481; AAA03229.1; -; Unassigned_DNA. 

DR EMBL; U82670; -; NOT_ANNOTATED_CDS ; Genomic_DNA. 

DR EMBL; AY148486; AAN62752.1; -; mRNA. 

DR EMBL; BT009789; AAP88791.1; -; mRNA. 

DR EMBL; BC017555; AAH17555.1; -; mRNA. 

DR PDB; 1W72; X-ray; C/F=161-169. 

DR Ensembl; ENSG0000012 6977 ; Homo sapiens. 

DR H-InvDB; HIX0017126; -. 

DR HGNC; HGNC:67 96; MAGEA1 . 

DR MIM; 300016; gene. 

DR GO; GO:0005886; C:plasma membrane; TAS . 

DR InterPro; IPR002190; MAGE. 

DR PANTHER; PTHR11736; MAGE; 1. 

DR Pfam; PF01454; MAGE; 1. 

DR PROSITE; PS50838; MAGE; 1. 

KW 3D-structure; Antigen; Polymorphism; Tumor antigen. 


FT 

CHAIN 

1 

309 

Melanoma-associated antigen 1. 

FT 




/FTId=PRO_0000156701 . 

FT 

DOMAIN 

102 

301 

MAGE. 

FT 

COMPBIAS 

33 

36 

Poly-Ser . 

FT 

VARIANT 

32 

32 

T -> A (probable polymorphism) 

FT 




/FTId-VAR_004283. 

FT 

VARIANT 

72 

72 

R -> Q (in dbSNP:2008144) . 

FT 




/FTId=VAR_011737 . 

FT 

MUTAGEN 

163 

163 

D->A: Abolishes HLA-A1 binding 

FT 

MUTAGEN 

169 

169 

Y->A: Abolishes HLA-A1 binding 
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SQ SEQUENCE 309 AA; 34342 MW; 54 4EEB1F9F4E9D33 CRC64; 


Query Match 100.0%; Score 52; DB 1; Length 309; 

Best Local Similarity 100.0%; Pred. No. 0.29; 

Matches 9; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I I I I I II I I 
Db 161 EADPTGHSY 169 


RESULT 2 
MAGAA_HUMAN 

ID MAGAA__HUMAN STANDARD; PRT; 369 AA. 

AC P4 33 63; 

DT 01-NOV-1995, integrated into UniProtKB/Swiss-Prot . 

DT 01-NOV-1995, sequence version 1. 

DT 07-FEB-2006, entry version 39. 

DE Melanoma-associated antigen 10 (MAGE- 10 antigen) . 

GN Name =MAGEA1 0 ; Synonyms=MAGE10; 

OS Homo sapiens (Human) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

OC Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; Hominidae; 

OC Homo . 

OX NCBI_Tax ID=9 60 6 ; 

RN [1] 

RP NUCLEOTIDE SEQUENCE. 

RX MEDLINE=95012457; PubMed=7927540; 

RA de Plaen E., Arden K., Traversari C, Gaforio J.J., Szikora J. -P., 

RA de Smet C, Brasseur F. , van der Bruggen P., Lethe B . , Lurquin C, 

RA Brasseur R., Chomez P., de Backer O., Cavenee W. , Boon T.; 

RT "Structure, chromosomal localization, and expression of 12 genes of 

RT the MAGE family."; 

RL Immunogenetics 40:360-369(1994). 

RN [2] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE MRNA] . 

RC TISSUE=Skin; 

RX MEDLINE=22388257; PubMed=124 77 932 ; DOI=10 . 1073/pnas . 242603899; 

RA Strausberg R.L., Feingold E.A., Grouse L.H., Derge J.G., 

RA Klausner R.D., Collins F.S., Wagner L., Shenmen CM., Schuler G.D., 

RA Altschul S.F., Zeeberg B., Buetow K.H., Schaefer C.F., Bhat N.K., 

RA Hopkins R.F., Jordan H., Moore T., Max S.I., Wang J., Hsieh F., 

RA Diatchenko L . , Marusina K., Farmer A. A. , Rubin G.M., Hong L., 

RA Stapleton M. , Soares M.B., Bonaldo M.F., Casavant T.L., Scheetz T.E., 

RA Brownstein M.J., Usdin T.B., Toshiyuki S., Carninci P., Prange C, 

RA Raha S.S., Loquellano N.A., Peters G.J., Abramson R.D., Mullahy S.J., 

RA Bosak S.A., McEwan P.J., McKernan K.J., Malek J. A. , Gunaratne P.H., 

RA Richards S., Worley K.C., Hale S., Garcia A.M., Gay L.J., Hulyk S.W., 

RA Villalon D.K., Muzny D.M., Sodergren E.J., Lu X., Gibbs R.A., 

RA Fahey J., Helton E . , Ketteman M. , Madan A., Rodrigues S., Sanchez A., 

RA Whiting M. , Madan A., Young A. C . , ' Shevchenko Y., Bouffard G.G., 

RA Blakesley R.W., Touchman J.W., Green E.D., Dickson M.C., 

RA Rodriguez A.C., Grimwood J., Schmutz J., Myers R.M., 

RA Butterfield Y.S.N., Krzywinski M.I., Skalska U., Smailus D.E., 

RA Schnerch A., Schein J.E., Jones S.J.M., Marra M.A. ; 

RT "Generation and initial analysis of more than 15,000 full-length human 

RT and mouse cDNA sequences. "; 

RL Proc. Natl. Acad. Sci. U.S.A. 99:16899-16903(2002). 

CC -!- FUNCTION: Not known, though may play a role in embryonal 
CC development and tumor transformation or aspects of tumor 

CC progression. 
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cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 

DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
KW 
FT 
FT 
FT 
FT 
FT 
FT 
SQ 


-!- TISSUE SPECIFICITY: Expressed in many tumors of several types, 
such as melanoma, head and neck squamous cell carcinoma, lung 
carcinoma and breast carcinoma, but not in normal tissues except 
for testes and placenta. 

-!- SIMILARITY: Contains 1 MAGE domain. 

Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 
Distributed under the Creative Commons Attribution-NoDerivs License 

EMBL; U10685; AAA688 69.1; -; Genomic_DNA. 
EMBL; BC004105; AAH04105.1; -; mRNA. 
PIR; 138659; 138659. 
Ensembl; ENSG0000012 42 60 ; 
H-InvDB; HIX0017116; -. 
HGNC; HGNC:67 97; MAGEA10 . 
MIM; 300343; gene. 
LinkHub; P43363; -. 
InterPro; IPR002190; MAGE. 
PANTHER; PTHR11736; MAGE; 
Pfam; PF01454; MAGE; 1. 
PROSITE; PS50838; MAGE; 1. 

Polymorphism; Tumor antigen. 


Homo sapiens. 


2. 


Antigen; 
CHAIN 

DOMAIN 

COMPBIAS 

VARIANT 

SEQUENCE 


369 


Melanoma-associated antigen 10. 
/FTId=PRO_0000156709 . 
MAGE. 
Poly-Ser . 

K -> R (in dbSNP:210585) . 
/FTId=VAR_024 528 . 
369 AA; 40767 MW; 16FA3301CAB716A6 CRC64; 


134 
54 
166 


333 
62 
166 


Query Match 84 . 6%; 

Best Local Similarity 77.8%; 
Matches 7; Conservative 


Score 44; DB 1; Length 369; 
Pred. No. 12; 
1; Mismatches 1; Indels 


0; Gaps 


Qy 


Db 


1 EADPTGHSY 9 
I I I I I I I : 
193 EVDPTGHSF 2 01 


RESULT 3 
MAGA8 _HUMAN 

ID MAGA8_HUMAN STANDARD; PRT; 234 AA. 

AC P43361; 

DT 01-NOV-1995, integrated into UniProtKB/Swiss-Prot . 

DT 01-NOV-1995, sequence version 1. 

DT 07-FEB-2006, entry version 32. 

DE Melanoma-associated antigen 8 (MAGE- 8 antigen) . 

GN Name=MAGEA8 ; Synonyms=MAGE8 ; 

OS Homo sapiens (Human) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

OC Mammalia; Eutheria; Euarchontoglires ; Primates; Catarrhini; Hominidae; 

OC Homo . 

OX NCBI_TaxID=9606; 

RN [1] 

RP NUCLEOTIDE SEQUENCE [GENOMIC DNA] . 

RX MEDLINE=95012457; PubMed=7927540; 

RA de Plaen E., Arden K., Traversari C, Gaforio J.J., Szikora J. -P., 

RA de Smet C, Brasseur F., van der Bruggen P., Lethe B., Lurquin C, 

RA Brasseur R., Chomez P., de Backer 0., Cavenee W. , Boon T.; 

RT "Structure, chromosomal localization, and expression of 12 genes of 

RT the MAGE family."; 
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RL 
CC 
CC 
CC 
CC 
CC 
CC 
CC 
CC 
CC 
CC 
CC 
CC 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
KW 
FT 
FT 
FT 
FT 
SQ 


Immunogenetics 40:360-369(1994). 

-!- FUNCTION: Not known, though may play a role in embryonal 
development and tumor transformation or aspects of tumor 
progression. 

-!- TISSUE SPECIFICITY: Expressed in many tumors of several types, 
such as melanoma, head and neck squamous cell carcinoma, lung 
carcinoma and breast carcinoma, but not in normal tissues except 
for testes and placenta. 

-!- SIMILARITY: Contains 1 MAGE domain. 

Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 
Distributed under the Creative Commons Attribution-NoDerivs License 

EMBL; U10693; AAA68876.1; -; Genomic_DNA. 
PIR; 138667; 138667. 

Ensembl; ENSG00000156009; Homo sapiens. 

HGNC; HGNC:6806; MAGEA8 . 

MIM; 300341; gene. 

InterPro; IPR002190; MAGE. 

PANTHER; PTHR11736; MAGE; 1. 

Pfam; PF01454; MAGE; 1. 

PROSITE; PS50838; MAGE; 1. 

Antigen; Tumor antigen. 


CHAIN 

DOMAIN 

COMPBIAS 

SEQUENCE 


112 
40 
2 34 AA; 


234 

234 
43 

25197 


MW; 


Melanoma-associated antigen 
/FTId=PRO_0000156707 . 
MAGE. 
Poly-Ser . 

058A92EE6003A982 CRC64; 


Query Match 82 . 7%; 

Best Local Similarity 77.8%; 
Matches 7; Conservative 


Score 43; DB 1; Length 234; 
Pred. No. 11; 
0; Mismatches 2; Indels 


Gaps 


0; 


Qy 


Db 


1 EADPTGHSY 9 
I II I I I I 
171 EVDPAGHSY 17 9 


RESULT 4 
MAGA9 _HUMAN 

ID MAG A 9 _H UMAN STANDARD; PRT; 315 AA. 

AC P43362; Q92910; 

DT 01-NOV-1995, integrated into UniProtKB/Swiss-Prot . 

DT 01-NOV-1995, sequence version 1. 

DT 07-FEB-2006, entry version 37. 

DE Melanoma-associated antigen 9 (MAGE- 9 antigen) . 

GN Name=MAGEA9; Synonyms=MAGE9; 

OS Homo sapiens (Human) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

0C Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; Hominidae; 

OC Homo . 

OX NCBI_TaxID=9606; 

RN [1] 

RP NUCLEOTIDE SEQUENCE. 

RX MEDLINE=95012457; PubMed=7 927 540 ; 

RA de Plaen E., Arden K. , Traversari C, Gaforio J.J., Szikora J. -P., 

RA de Smet C, Brasseur F., van der Bruggen P., Lethe B., Lurquin C, 

RA Brasseur R., Chomez P., de Backer O., Cavenee W., Boon T.; 

RT "Structure, chromosomal localization, and expression of 12 genes of 

RT the MAGE family."; 

RL Immunogenetics 40:360-369(1994). 
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RN [2] 

RP NUCLEOTIDE SEQUENCE. 

RA Timms K.M., Bondeson M.L., Ansari-Lari M.A., Lagerstedt K. , 

RA Nelson D.L., Pettersson U., Gibbs R.A.; 

RL Submitted (SEP-1996) to the EMBL/GenBank/DDBJ databases. 

RN [3] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE MRNA] . 

RC TISSUE=Lung; 

RX MEDLINE=22388257; PubMed=124 77932 ; DOI=10 . 1073/pnas . 2 42 6038 99 ; 

RA Strausberg R.L., Feingold E.A., Grouse L.H., Derge J.G., 

RA Klausner R.D., Collins F.S., Wagner L., Shenmen CM., Schuler G.D., 

RA Altschul S.F., Zeeberg B . , Buetow K.H., Schaefer C.F., Bhat N.K., 

RA Hopkins R.F., Jordan H., Moore T., Max S.I., Wang J., Hsieh F. , 

RA Diatchenko L., Marusina K. , Farmer A. A., Rubin G.M., Hong L., 

RA Stapleton M. , Soares M.B., Bonaldo M.F., Casavant T.L., Scheetz T.E., 

RA Brownstein M.J., Usdin T.B., Toshiyuki S., Carninci P., Prange C, 

RA Raha S.S., Loquellano N.A., Peters G.J., Abramson R.D., Mullahy S.J., 

RA Bosak S.A., McEwan P.J., McKernan K.J., Malek J. A. , Gunaratne P.H., 

RA Richards S., Worley K.C., Hale S., Garcia A.M. , Gay L.J., Hulyk S.W., 

RA Villalon D.K., Muzny D.M., Sodergren E.J., Lu X., Gibbs R.A., 

RA Fahey J., Helton E., Ketteman M. , Madan A. , Rodrigues S., Sanchez A., 

RA Whiting M., Madan A., Young A.C., Shevchenko Y . , Bouffard G.G., 

RA Blakesley R.W., Touchman J.W., Green E.D., Dickson M.C., 

RA Rodriguez A.C., Grimwood J., Schmutz J., Myers R.M., 

RA Butterfield Y.S.N. , Krzywinski M.I., Skalska U., Smailus D.E., 

RA Schnerch A., Schein J.E., Jones S.J.M., Marra M.A. ; 

RT "Generation and initial analysis of more than 15, 000 full-length human 

RT and mouse cDNA sequences."; 

RL Proc. Natl. Acad. Sci. U.S.A. 99:16899-16903(2002). 

CC -!- FUNCTION: Not known, though may play a role in embryonal 
CC development and tumor transformation or aspects of tumor 

CC progression. 

CC -!- TISSUE SPECIFICITY: Expressed in many tumors of several types, 
CC such as melanoma, head and neck squamous cell carcinoma, lung 

CC carcinoma and breast carcinoma, but not in normal tissues except 

CC for testes and placenta. 

CC SIMILARITY: Contains 1 MAGE domain. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; U10694; AAA68877.1; -; Genomic_DNA. 

DR EMBL; U66083; AAB67888.1; -; Genomic_DNA. 

DR EMBL; BC002351; AAH02351.1; -; mRNA. 

DR PIR; 138668; 138668. 

DR H-InvDB; HIX0017105; -. 

DR HGNC; HGNC:6807; MAGEA9 . 

DR MIM; 300342; gene. 

DR InterPro; IPR002190; MAGE. 

DR PANTHER; PTHR117 36; MAGE; 1. 

DR Pfam; PF01454; MAGE; 1. 

DR PROSITE; PS50838; MAGE; 1. 

KW Antigen; Tumor antigen. 

FT CHAIN 1 315 Melanoma-associated antigen 9. 

FT /FTId=PRO_0000156708 . 

FT DOMAIN 108 307 MAGE. 

FT COMPBIAS 34 37 Poly-Glu. 

FT COMPBIAS 87 90 Poly-Glu. 

SQ SEQUENCE 315 AA; 35088 MW; 7 FD2ED10D680D928 CRC64; 
Query Match 82.7%; Score 43; DB 1; Length 315; 
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Best Local Similarity 77.8%; Pred. No. 15; 
Matches 7; Conservative 0; Mismatches 


2; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

I II I I I I 
Db 167 EVDPAGHSY 175 


RESULT 5 
Q7Z5K4_HUMAN 

ID Q7Z5K4_HUMAN PRELIMINARY; PRT; 315 AA. 

AC Q7Z5K4; 

DT 01-OCT-2003, integrated into UniProtKB/TrEMBL . 

DT 01-OCT-2003, sequence version 1. 

DT 07-FEB-2006, entry version 8. 

DE Melanoma antigen family A 9 (Fragment) . 

GN Name=MAGEA9 ; 

OS Homo sapiens (Human) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

OC Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; Hominidae; 

OC Homo . 

OX NCBI_TaxID=9606; 

RN [1] 

RP NUCLEOTIDE SEQUENCE . 

RC TISSUE=Liver; 

RA Zhu J., Feng Z., Guan X.; 

RL Submitted (MAY-2003) to the EMBL/GenBank/DDB J databases. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; AY310325; AAP82171.1; -; mRNA. 

DR InterPro; IPR002190; MAGE. 

DR PANTHER; PTHR11736; MAGE; 1. 

DR Pfam; PF01454; MAGE; 1. 

DR PROSITE; PS50838; MAGE; 1. 

FT N0N_TER 315 315 

SQ SEQUENCE 315 AA; 35116 MW; C9 4 884 70D4 09B9 6F CRC64 ; 

Query Match 82.7%; Score 43; DB 2; Length 315; 

Best Local Similarity 77.8%; Pred. No. 15; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 

Qy 1 EADPTGHSY 9 

I II I I I I 
Db 167 EVDPAGHSY 175 


RESULT 6 

Q 9 BUN 9_HUMAN 

ID Q 9 BUN 9_HUMAN PRELIMINARY; PRT; 318 AA. 

AC Q9BUN9; 

DT 01-JUN-2001, integrated into UniProtKB/TrEMBL. 

DT 01-JUN-2001, sequence version 1. 

DT 07-FEB-2006, entry version 21. 

DE Melanoma antigen family A, 8 . 

GN Name=MAGEA8 ; 

OS Homo sapiens (Human) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

OC Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; Hominidae; 

OC Homo . 
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OX NCBI_TaxID=9606; 

RN [1] 

RP NUCLEOTIDE SEQUENCE. 

RC TISSUE=Skin; 

RX MEDLINE=22388257; PubMed=124 77 932 ; DOI=10 . 1073/pnas . 242603899; 

RA Strausberg R.L., Feingold E.A., Grouse L.H., Derge J.G., 

RA Klausner R.D., Collins F.S., Wagner L., Shenmen CM., Schuler G.D., 

RA Altschul S.F., Zeeberg B . , Buetow K.H., Schaefer C.F., Bhat N.K., 

RA Hopkins R.F., Jordan H., Moore T., Max S.I., Wang J., Hsieh F., 

RA Diatchenko L., Marusina K., Farmer A. A., Rubin G.M., Hong L., 

RA Stapleton M. , Soares M.B., Bonaldo M.F., Casavant T.L., Scheetz T.E., 

RA Brownstein M.J., Usdin T.B., Toshiyuki S., Carninci P., Prange C, 

RA Raha S.S., Loquellano N.A., Peters G.J., Abramson R.D., Mullahy S.J., 

RA Bosak S.A., McEwan P.J., McKernan K.J., Malek J. A., Gunaratne P.H., 

RA Richards S., Worley K.C., Hale S., Garcia A.M., Gay L.J., Hulyk S.W., 

RA Villalon D.K., Muzny D.M., Sodergren E.J., Lu X., Gibbs R.A., 

RA Fahey J., Helton E . , Ketteman M. , Madan A., Rodrigues S., Sanchez A., 

RA Whiting M. , Madan A., Young A.C., Shevchenko Y . , Bouffard G.G., 

RA Blakesley R.W., Touchman J.W., Green E.D., Dickson M.C., 

RA Rodriguez A.C., Grimwood J., Schmutz J., Myers R.M., 

RA Butterfield Y.S.N. , Krzywinski M.I., Skalska U., Smailus D.E., 

RA Schnerch A., Schein J.E., Jones S.J.M., Marra M.A.; 

RT "Generation and initial analysis of more than 15,000 full-length human 

RT and mouse cDNA sequences."; 

RL Proc. Natl. Acad. Sci. U.S.A. 99:16899-16903(2002). 

RN [2] 

RP NUCLEOTIDE SEQUENCE. 

RC TISSUE=Skin; 

RG NIH MGC Project; 

RL Submitted (FEB-2001) to the EMBL/GenBank/DDBJ databases. 

RN [3] 

RP NUCLEOTIDE SEQUENCE . 

RA Kalnine N., Chen X., Rolfs A., Halleck A., Hines L., Eisenstein S., 
RA ' Koundinya M. , Raphael J., Moreira D., Kelley T . , LaBaer J., Lin Y., 

RA Phelan M., Farmer A. ; 

RL Submitted (MAY-2003) to the EMBL/GenBank/DDBJ databases. 

RN [4] 

RP NUCLEOTIDE SEQUENCE. 

RC TISSUE=Skin; 

RA Director MGC Project; 

RL Submitted (AUG-2001) to the EMBL/GenBank/DDBJ databases. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; BC002455; AAH02455.1; -; mRNA. 

DR EMBL; BT007340; AAP36004.1; -; mRNA. 

DR EMBL; BC012744; AAH12744.1; -; mRNA. 

DR Ensembl; ENSG00000156009 ; Homo sapiens. 

DR InterPro; IPR002190; MAGE. 

DR PANTHER; PTHR11736; MAGE; 1. 

DR Pfam; PF01454; MAGE; 1. 

DR PROSITE; PS50838; MAGE; 1. 

SQ SEQUENCE 318 AA; 35215 MW; EA02C1FB42 F6C080 CRC64; 

Query Match 82.7%; Score 43; DB 2; Length 318; 

Best Local Similarity 77.8%; Pred. No. 15; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I II I I I I 
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Db 171 EVDPAGHSY 179 

RESULT 7 
MAGAB_HUMAN 

ID MAGAB_HUMAN STANDARD; PRT; 319 AA. 

AC P4 33 64; 

DT Ol-NOV-1995, integrated into UniProtKB/Swiss-Prot . 

DT Ol-NOV-1995, sequence version 1. 

DT 07-FEB-2006, entry version 36. 

DE Melanoma-associated antigen 11 (MAGE-11 antigen) . 

GN Name=MAGEAl 1 ; Synonyms=MAGEll; 

OS Homo sapiens (Human) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

OC Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; Hominidae; 

OC Homo . 

OX NCBI_TaxID=9606; 

RN [1] 

RP NUCLEOTIDE SEQUENCE. 

RX MEDLINE=95012457; PubMed=792 7540 ; 

RA de Plaen E., Arden K., Traversari C, Gaforio J.J., Szikora J. -P., 

RA de Smet C, Brasseur F. , van der Bruggen P., Lethe B., Lurquin C, 

RA Brasseur R . , Chomez P., de Backer 0., Cavenee W. , Boon T.; 

RT "Structure, chromosomal localization, and expression of 12 genes of 

RT the MAGE family."; 

RL Immunogenetics 40:360-369(1994). 

RN [2] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE MRNA] . 

RC TISSUE=Skin; 

RX MEDLINE=22388257; PubMed=124 77 932 ; DOI=10 . 1073/pnas . 242603899 ; 

RA Strausberg R.L., Feingold E.A., Grouse L.H., Derge J.G., 

RA Klausner R.D., Collins F.S., Wagner L., Shenmen CM., Schuler G.D., 

RA Altschul S.F., Zeeberg B . , Buetow K.H., Schaefer C.F., Bhat N.K., 

RA Hopkins R.F., Jordan .H., Moore T., Max S.I., Wang J., Hsieh F . , 

RA Diatchenko L., Marusina K. , Farmer A. A. , Rubin G.M., Hong L., 

RA Stapleton M. , Scares M.B., Bonaldo M.F., Casavant T.L., Scheetz T.E., 

RA Brownstein M.J., Usdin T.B., Toshiyuki S., Carninci P., Prange C, 

RA Raha S.S., Loquellano N.A., Peters G.J., Abramson R.D., Mullahy S.J., 

RA Bosak S.A., McEwan P.J., McKernan K.J., Malek J. A., Gunaratne P.H., 

RA Richards S., Worley K.C., Hale S., Garcia A.M., Gay L.J., Hulyk S.W., 

RA Villalon D.K., Muzny D.M., Sodergren E.J., Lu X., Gibbs R.A. , 

RA Fahey J., Helton E., Ketteman M. , Madan A., Rodrigues S., Sanchez A., 

RA Whiting M., Madan A., Young A.C., Shevchenko Y . , Bouffard G.G., 

RA Blakesley R.W., Touchman J.W., Green E.D., Dickson M.C., 

RA Rodriguez A.C., Grimwood J., Schmutz J., Myers R.M., 

RA Butterfield Y.S.N. , Krzywinski M.I., Skalska U., Smailus D.E., 

RA Schnerch A., Schein J.E., Jones S.J.M., Marra M.A. ; 

RT "Generation and initial analysis of more than 15,000 full-length human 

RT and mouse cDNA sequences."; 

RL Proc. Natl. Acad. Sci. U.S.A. 99:16899-16903(2002). 

CC -!- FUNCTION: Not known, though may play a role in embryonal 

CC development and tumor transformation or aspects of tumor 

CC progression. 

CC -!- INTERACTION: 

CC Q96AJ1:CLUAP1; NbExp=l; IntAct=EBI-739552 , EBI-739780; 

CC Q96C88:SH2D4A; NbExp=l; IntAct=EBI-739552, EBI-747035; 

CC Q15560:TCEA2; NbExp-1; IntAct=EBI-739552 , EBI-710310; 

CC -!- TISSUE SPECIFICITY: Expressed in many tumors of several types, 

CC such as melanoma, head and neck squamous cell carcinoma, lung 

CC carcinoma and breast carcinoma, but not in normal tissues except 

CC for testes and placenta. 


http://es/ScoreAccessWeb/Ge^ 8/30/06 


cc 
cc 
cc 
cc 
cc 

DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
KW 
FT 
FT 
FT 
SQ 


-!- SIMILARITY: Contains 1 MAGE domain. 


Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 
Distributed under the Creative Commons Attribution-NoDerivs License 

EMBL; U10686; AAA68870.1; -; Genomic_DNA. 
EMBL; BC004479; AAH04479.1; -; mRNA. 
PIR; 138660; 138660. 
IntAct; P4 33 64; 

Ensembl; ENSG00000185247 ; Homo sapiens. 
H-InvDB; HIX0022316; -. 
HGNC; HGNC:6798; MAGE All . 
MIM; 300344; gene. 
InterPro; IPR002190; MAGE. 
PANTHER; PTHR11736; MAGE; 1. 
Pfam; PF01454; MAGE; 1. 
PROSITE; PS50838; MAGE; 1. 
Antigen; Tumor antigen. 
CHAIN 1 319 


DOMAIN 112 311 

SEQUENCE 319 AA; 35536 MW; 


Melanoma-associated antigen 11 , 
/FTId=PRO_0000156710 . 
MAGE. 

F51A0B4140277BE3 CRC64; 


Query Match 80.8%; 
Best Local Similarity 77.8%; 
Matches 7 ; Conservative 


Score 42; DB 1; 
Pred. No. 24; 
0; Mismatches 


Length 319; 


Indels 


0; Gaps 


0; 


Qy 


Db 


1 EADPTGHSY 9 
I III III 
171 EVDPTSHSY 179 


RESULT 8 
Q6ZRZ5_HUMAN 

ID Q6ZRZ5_HUMAN PRELIMINARY; PRT; 394 AA. 

AC Q6ZRZ5; 

DT 05-JUL-2004, integrated into UniProtKB/TrEMBL . 

DT 05-JUL-2004, sequence version 1. 

DT 21-FEB-2006, entry version 8. 

DE CDNA FLJ45952 fis, clone PLACE7009563 , highly similar to Melanoma- 

DE associated antigen 11. 

OS Homo sapiens (Human) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

OC Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; Hominidae; 

OC Homo . 

OX NCBI_TaxID=9 60 6 ; 

RN [1] 

RP NUCLEOTIDE SEQUENCE. 

RC TISSUE=Placenta ; 

RA Tashiro H., Yamazaki M. , Watanabe K., Kumagai A., Itakura S., 

RA Fukuzumi Y., Fujimori Y., Komiyama M. , Sugiyama T., Irie R., 

RA Otsuki T., Sato H., Wakamatsu A., Ishii S., Yamamoto J., Isono Y., 

RA Kawai-Hio Y., Saito K., Nishikawa T., Kimura K. , Yamashita H., 

RA Matsuo K., Nakamura Y., Sekine M., Kikuchi H., Kanda K. , Wagatsuma M. , 

RA Murakawa K. , Kanehori K. , Takahashi-Fujii A., Oshima A., Sugiyama A., 

RA Kawakami B., Suzuki Y . , Sugano S., Nagahari K. , Masuho Y., Nagai K. , 

RA Isogai T.; 

RT "NEDO human cDNA sequencing project."; 

RL Submitted (JUL-2003) to the EMBL/GenBank/DDB J databases. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 
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CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; AK127849; BAC87161.1; -; mRNA. 

DR Ensembl; ENSG00000185247 ; Homo sapiens. 

DR LinkHub; Q6ZRZ5; -. 

DR InterPro; IPR002190; MAGE. 

DR PANTHER; PTHR11736; MAGE; 1. 

DR Pfam; PF01454; MAGE; 1. 

DR PROSITE; PS50838; MAGE; 1. 

SQ SEQUENCE 394 AA; 44276 MW; 36D7A8 1D87 4 9D8 96 CRC64; 

Query Match 80.8%; Score 42; DB 2; Length 394; 

Best Local Similarity 77.8%; Pred. No. 30; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I Ell III 
Db 246 EVDPTSHSY 254 


RESULT 9 
Q5ETU4_HUMAN 

ID Q5ETU4_HUMAN PRELIMINARY; PRT; 429 AA. 

AC Q5ETU4; 

DT 15-MAR-2005, integrated into UniProtKB/TrEMBL . 

DT 15-MAR-2005, sequence version 1. 

DT 07-FEB-2006, entry version 4. 

DE Melanoma antigen family A 11 . 

GN Name=MAGEAll ; 

OS Homo sapiens (Human) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

OC Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; Hominidae; 

OC Homo . 

OX NCBI_TaxID=9 606; 

RN [1] 

RP NUCLEOTIDE SEQUENCE. 

RC TISSUE=Testis; 

RX PubMed=15684378; DOI=10 . 1128/MCB . 25 . 4 . 1238-1257 . 2005; 

RA Bai S., He B., Wilson E.M.; 

RT "Melanoma Antigen Gene Protein MAGE- 11 Regulates Androgen Receptor 

RT Function by Modulating the Interdomain Interaction."; 

RL Mol. Cell. Biol. 25:12 38-1257(2005). 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; AY747607; AAW71787.1; -; mRNA. 

DR Ensembl; ENSG00000185247 ; Homo sapiens. 

DR InterPro; IPR002190; MAGE. 

DR PANTHER; PTHR11736; MAGE; 1. 

DR Pfam; PF01454; MAGE; 1. 

DR PROSITE; PS50838; MAGE; 1. 

SQ SEQUENCE 429 AA; 4812 9 MW; FB399ABF47B4C4 9B CRC64; 

Query Match 80.8%; Score 42; DB 2; Length 429; 

Best Local Similarity 77.8%; Pred. No. 33; 

Matches 7; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

I III III 
Db 281 EVDPTSHSY 289 
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RESULT 10 
PYRK BACAN 


ID PYRK_BACAN STANDARD; PRT; 259 AA. 

AC Q81WF3; Q6HUK1; Q6KNT6; 

DT 14-NOV-2003, integrated into UniProtKB/Swiss-Prot . 

DT 01-JUN-2003, sequence version 1. 

DT 07-MAR-2006, entry version 27. 

DE Dihydroorotate dehydrogenase electron transfer subunit. 

GN Name=pyrK; OrderedLocusNames=BA4024 , GBAA4024, BAS3736; 

OS Bacillus anthracis. 

OC Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; 

OC Bacillus cereus group. 

OX NCBI_TaxID=1392; 

RN [1] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA] . 

RC STRAIN=Ames / isolate Porton; 

RX MEDLINE=22608414; PubMed=1272162 9; DOI=10 . 1038/nature0158 6; 

RA Read T.D., Peterson S.N., Tourasse N.J., Baillie L.W., Paulsen I.T., 

RA Nelson K.E., Tettelin H., Fouts D.E., Eisen J. A., Gill S.R., 

RA Holtzapple E.K., Okstad O.A., Helgason E., Rilstone J . , Wu M. , 

RA Kolonay J.F., Beanan M.J., Dodson R.J., Brinkac L.M., Gwinn M.L., 

RA DeBoy R.T., Madpu R., Daugherty S.C., Durlcin A.S., Haft D.H., 

RA Nelson W.C., Peterson J.D., Pop M. , Khouri H.M., Radune D., 

RA Benton J.L., Mahamoud Y., Jiang L., Hance I.R., Weidman J.F., 

RA Berry K.J., Plaut R.D., Wolf A.M., Watkins K.L., Nierman W.C., 

RA Hazen A., Cline R.T., Redmond C, Thwaite J.E., White O., 

RA Salzberg S.L., Thomason B., Friedlander A.M., Koehler T.M., 

RA Hanna P.C., Kolstoe A.-B., Fraser CM.; 

RT "The genome sequence of Bacillus anthracis Ames and comparison to 

RT closely related bacteria."; 

RL Nature 423:81-86(2003). 

RN [2] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA] . 

RC STRAIN=Ames ancestor; 

RA Ravel J., Rasko D.A., Shumway M.F., Jiang L., Cer R.Z., Federova N.B., 

RA Wilson M. , Stanley S., Decker S., Read T.D., Salzberg S.L., 

RA Fraser C .M. ; 

RT "Bacillus anthracis comparative genomics."; 

RL Submitted (MAY-2004) to the EMBL/GenBank/DDBJ databases. 

RN [3] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA] . 

RC STRAIN=Sterne; 

RA Brettin T.S., Bruce D., Challacombe J.F., Gilna P., Han C, Hill K. , 

RA Hitchcock P., Jackson P., Keim P., Longmire J., Lucas S., Okinaka R., 

RA Richardson P., Rubin E., Tice H.; 

RT "Complete genome sequence of Bacillus anthracis Sterne."; 

RL Submitted (JAN-2004) to the EMBL/GenBank/DDBJ databases. 

CC -!- FUNCTION: Is responsible for channelling the electrons from the 

CC oxidation of dihydroorotate from the FMN redox center in the pyrD 

CC subunit to the ultimate electron acceptor NAD ( +) (By similarity). 

CC -!- COFACTOR: Binds 1 2Fe-2S cluster per subunit (By similarity). 

CC -!- COFACTOR: Binds 1 FAD per subunit (By similarity). 

CC -!- PATHWAY: Nucleotide biosynthesis; UMP biosynthesis; UMP from 

CC HCO(3) (-) : step 4 . 

CC -!- PATHWAY: Context: Pyrimidine biosynthesis. 

CC -!- SUBUNIT: Heterotetramer of 2 pyrK and 2 pyrD subunits (By 
CC similarity) . 

CC -!- SIMILARITY: Belongs to the pyrK family. 

CC 
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cc 
cc 
cc 

DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
DR 
KW 
KW 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
SQ 


Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 
Distributed under the Creative Commons Attribution-NoDerivs License 


Genomic_DNA. 
Genomic_DNA. 
Genomic DNA. 


EMBL; AE016879; AAP27751.1; 
EMBL; AE017334; AAT33141.1; 
EMBL; AE017225; AAT56038.1; 
HSSP; P56968; 1EP3. 
GenomeReviews; AE016879_GR; 
GenomeRe views; AE017225_GR; 
GenomeReviews; AE017 334_GR; 
TIGR; BA4024; -. 
TIGR; GBAA4024; -. 
HAMAP; MF_01211; -; 1. 
InterPro; IPR006058; 2Fe2S_ 
IPR012165; 
IPR008333; 
IPR001433; 

IPR000951; _ _ 
Pfam; PF00970; FAD_binding_6; 1. 
Pfam; PF0017 5; NAD_binding_l ; 1. 
PIRSF; PIRSF006816; Cyc3_hyd_g; 1. 
PRINTS; PR00409; PHDIOXRDTASE . 

2Fe-2S; Complete proteome; Electron transport; FAD; Flavoprotein; 
Iron; Iron-sulfur; Metal-binding; Pyrimidine biosynthesis; Transport. 
CHAIN 1 259 Dihydroorotate dehydrogenase electron 

transfer subunit. 

/FTId=PRO 0000148353. 


InterPro; 
InterPro; 
InterPro; 
InterPro; 


BA402 4 . 

BAS3736. 

GBAA4024. 


_f d_BS . 
Cyc3_hyd_g . 
Oxred_FAD_bd . 
Oxr ed_FAD_NAD_bd . 
Ph dOase redase. 


METAL 

221 

221 

Iron-sulfur 

(2Fe-2S) 

(By 

similarity) 

METAL 

226 

226 

Iron-sulfur 

(2Fe-2S) 

(By 

similarity) 

METAL 

229 

229 

Iron-sulfur 

(2Fe-2S) 

(By 

similarity) 

METAL 

246 

246 

Iron-sulfur 

(2Fe-2S) 

(By 

similarity) 

SEQUENCE 

259 AA; 

28439 

MW; DC2768827E220805 CRC64; 



Query Match 7 6.9%; 

Best Local Similarity 66.7%; 
Matches 6; Conservative 


Score 40; DB 1; 
Pred. No. 47; 
2; Mismatches 


Length 2 59; 


1; Indels 


0 ; Gaps 


Qy 


Db 


1 EADPTGHSY 9 
: I I : I I I I 
234 QEDPSGHSY 242 


RESULT 11 
PYRK_BACCR 

ID PYRK_BACCR STANDARD; PRT; 259 AA. 

AC Q819S4; 

DT 14-NOV-2003, integrated into UniProtKB/Swiss-Prot . 
DT 01-JUN-2003, sequence version 1. 
DT 07-MAR-2006, entry version 24. 

DE Dihydroorotate dehydrogenase electron transfer subunit. 

GN Name=pyrK; Order edLocusNames=BC38 8 5 ; 

OS Bacillus cereus (strain ATCC 14579 / DSM 31). 

OC Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; 

OC Bacillus cereus group. 

OX NCBI_TaxID=226900; 

RN [1] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA] . 

RX MEDLINE=22608415; PubMed=12721630 ; DOI=10 . 1038/nature01582 ; 

RA Ivanova N . , Sorokin A., Anderson I., Galleron N. , Candelon B., 

RA Kapatral V., Bhattacharyya A., Reznik G., Mikhailova N . , Lapidus A., 

RA Chu L., Mazur M. , Goltsman E . , Larsen N., D f Souza M. , Walunas T., 
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RA Grechkin Y., Pusch G . , Haselkorn R., Fonstein M. , Ehrlich S.D., 

RA Overbeek R., Kyrpides N.C.; 

RT "Genome sequence of Bacillus cereus and comparative analysis with 

RT Bacillus anthracis."; 

RL Nature 423:87-91(2003). 

CC -!- FUNCTION: Is responsible for channelling the electrons from the 

CC oxidation of dihydroorotate from the FMN redox center in the pyrD 

CC subunit to the ultimate electron acceptor NAD (+) (By similarity). 

CC -!- COFACTOR: Binds 1 2Fe-2S cluster per subunit (By similarity). 

CC -!- COFACTOR: Binds 1 FAD per subunit (By similarity). 

CC -!- PATHWAY: Nucleotide biosynthesis; UMP biosynthesis; UMP from 

CC HC0(3) (-) : step 4 . 

CC -!- PATHWAY: Context: Pyrimidine biosynthesis. 

CC -!- SUBUNIT: Heterotetramer of 2 pyrK and 2 pyrD subunits (By 

CC similarity) . 

CC -!- SIMILARITY: Belongs to the pyrK family. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; AE016877; AAP10806.1; -; Genomic_DNA. 

DR HSSP; P56968; 1EP3. 

DR GenomeRe views; AE016877_GR; BC3885. 

DR BioCyc; BCER226900 : BC3885-MONOMER; 

DR HAMAP; MF_01211; -; 1. 

DR InterPro; IPR006058; 2Fe2S_fd_BS. 

DR InterPro; IPR012165; Cyc3_hyd_g. 

DR InterPro; IPR008333; Oxred_FAD_bd . 

DR InterPro; IPR001433; Oxred_FAD_NAD_bd . 

DR InterPro; IPR000951; Ph_dOase_redase . 

DR Pfam; PF00970; FAD_binding_6; 1. 

DR Pfam; PF00175; NAD_binding_l ; 1. 

DR PIRSF; PIRSF006816; Cyc3_hyd_g; 1. 

DR PRINTS; PR00409; PHDIOXRDTASE . 

KW 2Fe-2S; Complete proteome; Electron transport; FAD; Flavoprotein; 

KW Iron; Iron-sulfur; Metal-binding; Pyrimidine biosynthesis; Transport. 

FT CHAIN 1 259 Dihydroorotate dehydrogenase electron 

FT transfer subunit. 

FT /FTId=PRO_0000148354 . 

FT METAL 221 221 Iron-sulfur (2Fe-2S) (By similarity) . 

FT METAL 226 226 Iron-sulfur (2Fe-2S) (By similarity) . 

FT METAL 229 229 Iron-sulfur (2Fe-2S) (By similarity) . 

FT METAL 246 246 Iron-sulfur (2Fe-2S) (By similarity). 

SQ SEQUENCE 259 AA; 28416 MW; D8F893A27E25919B CRC64; 

Query Match 76.9%; Score 40; DB 1; Length 259; 
Best Local Similarity 66.7%; Pred. No. 47; 

Matches 6; Conservative 2; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

: I I : I I I I 

Db 234 QEDPSGHSY 2 42 

RESULT 12 
Q3ENC9_BACTI 

ID Q3ENC9_BACTI PRELIMINARY; PRT; 259 AA. 

AC Q3ENC9; 

DT 08-NOV-2005, integrated into UniProtKB/TrEMBL . 

DT 08-NOV-2005, sequence version 1. 

DT 07-FEB-2006, entry version 3. 
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DE Dihydroorotate dehydrogenase electron transfer subunit (EC 1.3.3.1). 

GN ORFNames=RBTH_02089; 

OS Bacillus thuringiensis serovar israelensis ATCC 35646. 

OC Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; 

OC Bacillus cereus group. 

OX NCBI_TaxID=339854; 

RN [1] 

RP NUCLEOTIDE SEQUENCE. 

RC STRAIN=ATCC 3564 6; 

RA Anderson I., Sorokin A., Kapatral V., Reznik G. , Bhattacharya A., 

RA Mikhailova N., Burd H . , Joukov V., Kaznadzey D . , Walunas T., 

RA D'Souza M. , Larsen N . , Pusch G. , Liolios K. , Grechkin Y., Lapidus A., 

RA Goltsman E . , Chu L., Fonstein M. , Ehrlich D., Overbeek R., 

RA Kyrpides N., Ivanova N.; 

RT "Comparative genome analysis of Bacillus cereus group genomes with 

RT Bacillus subtilis."; 

RL Submitted ( SEP- 2 00 5 ) to the EMBL/ GenBank/DDB J databases. 

CC -!- CAUTION: The sequence shown here is derived from an 

CC EMBL/GenBank/DDBJ whole genome shotgun (WGS) entry which is 

CC preliminary data . 

cc 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; AAJM01000353 ; EA052817.1; -; Genomic_DNA. 

DR GO; GO: 0004158; F : dihydroorotate oxidase activity; IEA. 

DR GO; GO: 0050660; F: FAD binding; IEA. 

DR GO; GO:0005506; F:iron ion binding; IEA. 

DR GO; GO: 00164 91; F : oxidoreductase activity; IEA. 

DR GO; GO:0006118; P:electron transport; IEA. 

DR GO; GO: 0006221; P:pyrimidine nucleotide biosynthesis; IEA. 

DR InterPro; IPR012165; Cyc3_hyd_g. 

DR InterPro; IPR008333; Oxred_FAD_bd . 

DR InterPro; IPR001433; Ox r e d_F AD_NAD_bd . 

DR InterPro; IPR000951; Ph_dOase_redase . 

DR Pfam; PF00970; FAD_binding_6; 1. 

DR Pfam; PF00175; NAD_binding_l ; 1. 

DR PIRSF; PIRSF006816; Cyc3_hyd_g; 1. 

DR PRINTS; PR00409; PHDIOXRDTASE . 

KW Oxidoreductase. 

SQ SEQUENCE 259 AA; 28444 MW; E39A55E1651347 82 CRC64; 

Query Match 76.9%; Score 40; DB 2; Length 259; 

Best Local Similarity 66.7%; Pred. No. 47; 

Matches 6; Conservative 2; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

: 11:1111 
Db 234 QEDPSGHSY 242 


RESULT 13 
Q4MJ4 3_BACCE 

ID Q4MJ43_BACCE PRELIMINARY; PRT; 259 AA. 
AC Q4MJ43; 

DT 02-AUG-2005, integrated into UniProtKB/TrEMBL . 
DT 02-AUG-2005, sequence version 1. 
DT 07-FEB-2006, entry version 2. 

DE Dihydroorotate dehydrogenase electron transfer subunit. 
GN Name=pyrDII; ORFNames=BCE_G9241_3870; 
OS Bacillus cereus G9241. 
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OC Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; 

OC Bacillus cereus group. 

OX NCBI_TaxID=2 69801; 

RN [1] 

RP NUCLEOTIDE SEQUENCE. 

RC STRAIN=G9241; 

RX PubMed=15155910; DOI=10 . 1073/pnas . 0402414 101; 

RA Hoffmaster A.R., Ravel J., Rasko D.A., Chapman G.D., Chute M.D., 

RA Marston C.K., De B.K., Sacchi C.T., Fitzgerald C, Mayer L.W., 

RA Maiden M.C.J. , Priest F.G., Barker M. , Jiang L., Cer R.Z., 

RA Rilstone J., Peterson S.N., Weyant R.S., Galloway D.R., Read T.D., 

RA Popovic T., Fraser CM.; 

RT "Identification of anthrax toxin genes in a Bacillus cereus associated 

RT with an illness resembling inhalation anthrax."; 

RL Proc. Natl. Acad. Sci. U.S.A. 101:8449-8454(2004). 

CC -!- CAUTION: The sequence shown here is derived from an 

CC EMBL/GenBank/DDBJ whole genome shotgun (WGS) entry which is 

CC preliminary data. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; AAEK0100004 9 ; EAL12213.1; -; Genomic_DNA. 

DR GO; GO:0050660; F:FAD binding; IEA. 

DR GO; GO: 0005506; F:iron ion binding; IEA. 

DR GO; GO: 00164 91; F : oxidoreductase activity; IEA. 

DR GO; GO: 0006118; P: electron transport; IEA. 

DR GO; GO: 0006221; P:pyrimidine nucleotide biosynthesis; IEA. 

DR InterPro; IPR012165; Cyc3_hyd_g. 

DR InterPro; IPR000951; Ph_dOase_redase . 

DR Pfam; PF00970; FAD_binding_6; 1. 

DR Pfam; PF0017 5; NAD_binding_l ; 1. 

DR PIRSF; PIRSF006816; Cyc3_hyd_g; 1. 

DR PRINTS; PR00409; PHDIOXRDTASE . 

SQ SEQUENCE 259 AA; 28421 MW; DDE1B379910A3D10 C RC 64; 

Query Match 76.9%; Score 40; DB 2; Length 259; 

Best Local Similarity 66.7%; Pred. No. 47; 

Matches 6; Conservative 2; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

: I I : I I I I 
Db 234 QEDPSGHSY 242 


RESULT 14 
Q636E1_BACCZ 


ID 

Q636E1_BACCZ PRELIMINARY; PRT; 259 AA. 




AC 

Q636E1; 




DT 

25-OCT-2004, integrated into UniProtKB/TrEMBL . 




DT 

25-OCT-2004, sequence version 1. 




DT 

07-FEB-2006, entry version 11. 




DE 

Dihydroorotate dehydrogenase, electron transfer 

subunit 

(EC 

1.3.3.1) 

GN 

Name=pyrK; OrderedLocusNames=BCE33L3644 ; 




OS 

Bacillus cereus (strain ZK / E33L) . 




OC 

Bacteria; Firmicutes; Bacillales; Bacillaceae; 

Bacillus; 



OC 

Bacillus cereus group. 




OX 

NCBI TaxID=288681; 




RN 

[1] 




RP 

NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA] . 




RA 

Brettin T.S., Bruce D., Challacombe J.F., Gilna 

P., Han 

c, 

Hill K., 
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RA Hitchcock P., Jackson P., Keim P., Longmire J . , Lucas S., Okinaka R., 

RA Richardson P., Rubin E . , Tice H.; 

RT "Complete genome sequence of Bacillus cereus ZK."; 

RL Submitted (JUL-2004) to the EMBL/GenBank/DDBJ databases. 

cc 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; CP000001; AAU16622.1; -; Genomic_DNA. 

DR GO; GO: 0004158; F:dihydroorotate oxidase activity; IEA. 

DR GO; GO: 0050660; F: FAD binding; IEA. 

DR GO; GO: 0005506; F:iron ion binding; IEA. 

DR GO; GO: 0016491; F : oxidoreductase activity; IEA. 

DR GO; GO: 0006118; P: electron transport; IEA. 

DR GO; GO: 0006221; Prpyrimidine nucleotide biosynthesis; IEA. 

DR InterPro; IPR012165; Cyc3__hyd_g. 

DR InterPro; IPR008 333; Oxred_FAD_bd . 

DR InterPro; IPR001433; Oxred_FAD_NAD_bd . 

DR InterPro; IPR000 951; Ph_dOase_redase . 

DR Pfam; PF00970; FAD_binding_6; 1. 

DR Pfam; PF0017 5; NAD_binding_l ; 1. 

DR PIRSF; PIRSF006816; Cyc3_hyd_g; 1. 

DR PRINTS; PR00409; PHDIOXRDTASE . 

KW Complete proteome; Oxidoreductase. 

SQ SEQUENCE 259 AA; 28439 MW; DC2768827E220805 CRC64; 

Query Match 76.9%; Score 40; DB 2; Length 259; 

Best Local Similarity 66.7%; Pred. No. 47; 

Matches 6; Conservative 2; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 EADPTGHSY 9 

: I I : I I I I 
Db 234 QEDPSGHSY 242 


RESULT 15 


Q6HES9 BACHK 


ID 

Q6HES9_BACHK PRELIMINARY; PRT; 259 AA. 


AC 

Q6HES9; 


DT 

19- JUL-2004, integrated into UniProtKB/TrEMBL . 


DT 

19- JUL-2004, sequence version 1. 


DT 

07-FEB-2006, entry version 11. 


DE 

Dihydroorotate dehydrogenase, electron transfer subunit (EC 

1.3.3.1) . 

GN 

Name=pyrK; OrderedLocusNames=BT9727_3627 ; 


OS 

Bacillus thuringiensis subsp . konkukian. 


OC 

Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; 


OC 

Bacillus cereus group. 


OX 

NCBI TaxID=180856; 


RN 

[1] 


RP 

NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA] . 


RC 

STRAIN=97-27; 


RA 

Brettin T.S., Bruce D., Challacombe J.F., Gilna P., Han C, 

Hill K. , 

RA 

Hitchcock P., Jackson P., Keim P., Longmire J., Lucas S., Okinaka R., 

RA 

Richardson P., Rubin E., Tice H.; 


RT 

"Complete genome sequence of Bacillus thuringiensis 97-27."; 


RL 
CC 
CC 

Submitted (JUN-2004) to the EMBL/GenBank/DDBJ databases. 


Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC 
CC 
DR 

Distributed under the Creative Commons Attribution-NoDerivs 

License 

EMBL; AE017355; AAT60634.1; -; Genomic_DNA. 
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DR GO; GO: 0004158; F: dihydroorotate oxidase activity; IEA. 

DR GO; GO: 0050660; F: FAD binding; IEA. 

DR GO; GO: 0005506; Friron ion binding; IEA. 

DR GO; GO:0016491; F: oxidoreductase activity; IEA. 

DR GO; GO: 0006118; P: electron transport; IEA. 

DR GO; GO:0006221; P :pyrimidine nucleotide biosynthesis; IEA. 

DR InterPro; IPR012165; Cyc3_hyd_g. 

DR InterPro; IPR008 333; Oxred_FAD_bd . 

DR InterPro; IPR001433; Oxred_FAD_NAD_bd . 

DR InterPro; IPR000 951; Ph_dOase_redase . 

DR Pfam; PF0097 0; FAD_binding_6; 1. 

DR Pfam; PF0017 5; NAD_binding_l ; 1. 

DR PIRSF; PIRSF006816; Cyc3_hyd_g; 1. 

DR PRINTS; PR00409; PHDIOXRDTASE . 

KW Complete proteome; Oxidoreductase. 

SQ SEQUENCE 259 AA; 28439 MW; DC2768827E220805 CRC64; 


Query Match 76.9%; Score 40; DB 2; Length 259; 

Best Local Similarity 66.7%; Pred. No. 47; 

Matches 6; Conservative 2; Mismatches 1; Indels 0; Gaps 0; 


Qy 1 EADPTGHSY 9 

: I I : I I I I 
Db 234 QEDPSGHSY 242 


Search completed: August 25, 2006, 00:59:28 
Job time : 302 sees 


SCORE 1.3 BuildDate: 12/06/2005 
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SCORE Search Results Details for Application 
08819669 and Search Result us-08-819-669e- 
8.rge, 

Score Home Retrieve Application SCORE System SCORE Comments / 

Page List Overview FAQ Suggestions 

This page gives you Search Results detail for the Application 08819669 and Search Result us-08- 

819-669e-8.rge. 

start 

Go Back to previous page 

GenCore version 5.1.9 
Copyright (c) 1993 - 2006 Biocceleration Ltd. 


OM nucleic - nucleic search, using sw model 
Run on: 


Title: 

Perfect score: 
Sequence : 

Scoring table: 


August 25, 2006, 09:08:38 ; Search time 30844 Seconds 

(without alignments) 
11763.639 Million cell updates/sec 

US-08-819-669E-8 
5674 

1 CCCGGGGCACCACTGGCATC TAATGATCTTGGGTGGATCC 5 674 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 


Searched: 6366136 seqs, 31973710525 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 


12732272 


Database : GenEmbl:* 


1 


gb_env : * 

2 


gb_pat : * 

3 


gb_ph : * 

4 


gb_pl : * 

5 


gb_pr : * 

6 


gb_ro : * 

7 


gb_sts : * 

8 


gb_sy : * 

9 


gb_un : * 

10 

gb_vi : * 

11 

gb_o v : * 

12 

gb htg:* 

13 

gb_in: * 

14 

gb_om : * 

15 

gb_ba : * 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 

% 

Result Query 

No. Score Match Length DB ID Description 



1 

5674 

100. 

,0 

5674 

2 

AR060975 

AR060975 Sequence 


2 

5674 

100. 

,0 

5674 

2 

AR153499 

AR153499 Sequence 


3 

5674 

100. 

,0 

5674 

2 

124013 

124013 Sequence 1 


4 

5674 

100. 

,0 

5674 

2 

136923 

136923 Sequence 8 


5 

5674 

100. 

,0 

5674 

2 

AR268060 

AR268060 Sequence 


6 

5674 

100. 

,0 

5674 

2 

AR322041 

AR322041 Sequence 


7 

5674 

100. 

,0 

5674 

2 

AR361125 

AR361125 Sequence 


8 

5674 

100. 

,0 

5674 

2 

AR721150 

AR721150 Sequence 

c 

9 

5567.8 

98. 

.1 

88597 

5 

AC152005 

AC152005 Homo sapi 

c 

10 

5535.8 

97. 

. 6 

40359 

5 

AC153070 

AC153070 Homo sapi 

c 

11 

2763.2 

48. 

,7 

169351 

5 

AC116666 

AC116666 Homo sapi 

c 

12 

2763.2 

48. 

.7 

173962 

5 

AF274856 

AF27485 6 Homo sapi 


13 

2655 

46. 

.8 

11495 

2 

AR167373 

AR167373 Sequence 


14 

2655 

46. 

.8 

11495 

5 

HSU10687 

U10687 Human MAGE- 


15 

2654.8 

46. 

.8 

161664 

5 

U82696 

U82 696 Homo sapien 


16 

2654.8 

46, 

.8 

200395 

5 

AF274855 

AF2 74855 Homo sapi 


17 

2513. 6 

44. 

.3 

4895 

2 

AR167374 

AR167374 Sequence 


18 

2513. 6 

44. 

.3 

4895 

2 

AX658231 

AX658231 Sequence 


19 

2513. 6 

44. 

.3 

4895 

5 

HSU10688 

U10688 Human MAGE- 


20 

2429. 6 

42. 

.8 

4736 

2 

AR167376 

AR167376 Sequence 


21 

2429. 6 

42. 

.8 

4736 

5 

HSU10690 

U10690 Human MAGE- 


22 

2422.8 

42. 

.7 

4741 

2 

AR167375 

AR167375 Sequence 


23 

2422.8 

42, 

.7 

4741 

2 

AX658171 

AX658171 Sequence 


24 

2422.8 

42. 

.7 

4741 

5 

HSU10689 

U10 689 Human MAGE- 


25 

2419 

42 . 

.6 

2419 

2 

AR153498 

AR153498 Sequence 


26 

2419 

42. 

.6 

2419 

2 

136922 

136922 Sequence 7 


27 

2419 

42. 

.6 

2419 

2 

AR268059 

AR268059 Sequence 


28 

2419 

42, 

. 6 

2419 

2 

AR322040 

AR322040 Sequence 


29 

2419 

42. 

. 6 

2419 

2 

AR361124 

AR361124 Sequence 


30 

2419 

42, 

. 6 

2419 

2 

AR721149 

AR721149 Sequence 


31 

2408 

42 , 

.4 

2420 

2 

AR007331 

AR007331 Sequence 


32 

2408 

42 . 

. 4 

2420 

2 

AR167368 

AR167368 Sequence 


33 

i 2408 

42, 

.4 

2420 

2 

CQ977089 

CQ977089 Sequence 


34 

2408 

42, 

.4 

2420 

2 

DD161424 

DD161424 EPITOPE S 


35 

2408 

42, 

.4 

2420 

2 

AR236284 

AR236284 Sequence 


36 

2408 

42, 

.4 

2420 

2 

AX658175 

AX658175 Sequence 


37 

2408 

42 

.4 

2420 

5 

HUMMAG1A 

M77481 Human antig 

c 

38 

2405. 8 

42 

.4 

204030 

12 

AC146919 

AC146919 Pongo pyg 

c 

39 

2405. 8 

42 

.4 

234364 

12 

AC148185 

AC148185 Pongo pyg 


40 

2404.2 

42 

.4 

204030 

12 

AC146919 

AC146919 Pongo pyg 


41 

2404.2 

42 

.4 

234364 

12 

AC148185 

AC148185 Pongo pyg 

c 

42 

2353 

41 

.5 

164994 

12 

AC148183 

AC148183 Macaca mu 

c 

43 

2353 

41 

.5 

168595 

12 

AC146354 

AC146354 Macaca mu 


44 

2328 

41 

.0 

178515 

12 

AC009621 

AC009621 Homo sapi 


45 

2313.4 

40 

.8 

181915 

5 

AC145689 

AC145689 Pan trogl 


ALIGNMENTS 


RESULT 1 
AR060975 
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LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
FEATURES 

source 


ORIGIN 


AR060975 
Sequence 
AR060975 
AR060975. 


1 from patent 


5674 bp 
US 5843448, 


DNA 


linear PAT 29-SEP-1999 


GI:5988666 


Unknown. 

Unknown . 

Unclassified. 

1 (bases 1 to 5674) 

Chen,Y.-T., Stockert,E., Chen,Y., Garin-Chesa, P. , Rettig,W.J. and 
Old, L.J. 

Tumor rejection antigen precursor 
Patent: US 5843448-A 1 01-DEC-1998; 

Location/Qualifiers 

1. .5674 

/organism= "unknown" 
/mol_type=" una s signed DNA" 


Query Match 100.0%; Score 5674; DB 2; Length 5674; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5674; Conservative 0; Mismatches 0; Indels 0; 


Gaps 


Qy 


Db 


CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 


Qy 

Db 


61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I j I I I I I I I IE I I I I I I I E I I M 
61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 


Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 


121 


121 


181 


181 


241 


241 


301 


301 


361 


361 


421 


421 


481 


481 


541 


C TC TC AAC C C AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC T GAC T T GAGC AT T AGT GG 180 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C T C T C AAC C C AGGGAAGC C C AGGT GC C C AGAT G TGAC GC C AC T GAC T T GAGC AT T AGT GG 180 

T T AGAGAGAAGC GAGGT T T T C GGT C T GAGGGGC GGC T T GAGAT C GGT GGAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I II j I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T TAGAGAGAAGC GAGGT T T T C GGT C T GAGGGGC GGC T T GAGAT C GGTGGAGGGAAGC GGG 24 0 

CC C AGC T C T GT AAGGAGGC AAGGT GAC ATGC T GAGGGAGGAC TGAGGAC C CAC T TAC C C C 300 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
CC C AGC T C T GT AAGGAGGC AAGGT GAC AT GC T GAGG GAGG AC T GAGGAC C CAC T TAC C C C 300 

AGAT AG AGGAC C C C AAAT AAT CC C T T CAT GC C AGT C C T GGAC CAT C T G G T GG TGGAC T T C 360 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGAT AGAGGAC C C C AAAT AAT CCC T T CAT GC C AGT C C T GGAC CATC T GGT GG T GGAC T T C 360 

TC AGGC T GGGC CAC C C C C AGC C CC C T T GC TGC T TAAAC CAC T GGGGAC T C GAAGT C AGAG 420 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 


CTCCGTGT GAT C AGGGAAGGGC TGC T T AGGAGAGGG C AGC GT C C AGGC T C T GC C AGAC AT 
I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 


480 


480 


540 


CAT GC T C AGGAT T C TC AAGGAGGGC T GAGGG T C CC T AAGACC C C AC T C C C GT GAC C C AAC 
I i I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAT GC TC AGGAT T C T C AAGGAGGG C T GAGGGT C CC T AAGAC C C C AC TC C C GT GAC C C AAC 540 


CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 


600 
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Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 721 CC AGGAAAC AT CC GGGT GC CC GGATGTGAC GC C AC T GAC T TGC GC AT T GTGGGGC AGAGA 780 

Qy 781 GAAGC GAGGT T TC C AT TC T GAGGGACGGC G T AGAGT TC GGC C GAAGGAAC C T GAC C C AGG 840 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I II I I I I I II I I I I I I I I 
Db 781 GAAGC GAGG T T T C C AT TC T GAGGGACGGC GT AGAGT TC GGC C GAAGGAAC C T GAC CC AGG 840 

Qy 841 C T C T G T G AGGAGGC AAGGT GAGAGGC T GAGGGAGGAC TGAGGAC CC C GC C AC T C C AAATA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

Qy 901 GAGAGC C C C AAATAT T C C AGC CCCGCCCTT GC T GC C AGC C C T GGCC C AC CC GC GGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 C G T C T C AGC CTGGGCTGCCCC C AG AC C C C T GC T C C AAAAG C C T T GAGAGAC AC C AG G T T C 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 C GT C T C AGC C T GGGC TGC C C C C AGACC C C TGC T C C AAAAGC C T T GAGAGAC AC CAGGT TC 1020 

Qy 1021 T T C TC C C C AAGC T-C T GGAATC AGAGGT T GC T G T GAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 T TC TC C C C AAGC TC T GGAAT C AGAGGT T GC TG T GAC C AGGGC AGGAC TGGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 12 60 

I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 T GAAC C T C AC AGAT C T GAGAGAAGC CAG GT T CAT T T AATG GT TC T GAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T GAACC T C AC AGATC TGAGAGAAGC CAGGT TC AT TT AAT GG T T C TGAGGGGC GGC T TGAG 1500 
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Qy 1501 ATC C AC T GAGGGGAG TGGT T T T AGGC TC TGTGAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 AT C C AC T GAGGGGAG TGG T T T T AGGC TC TGTGAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

Qy 1561 AC T GAGG AGGC AC AC AC C C C AGGT AGAT GGC C CC AAAATGAT C C AGT AC C AC CCC T GC TG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AC T GAGG AGGC AC AC AC C C C AGGT AGAT GGC C CC AAAAT GAT C C AGT AC C AC CCC T GC T G 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 C AC TGC C AC T T AAC C C AC AGGGC AAT C T G T AG TC AT AGC T TAT G T GAC C GGGGC AGGGT T 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 AC C C T GGGAGGGAAC TGAGGGT T C C C C AC C C AC AC CTGTCTCCT CAT C T C C ACC GC C AC C 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I II I I I II I I I I I 
Db 1801 ACC C TGGGAGGGAAC TGAGGGT TC CCC ACCC AC AC CTGTCTCCTC ATC TCC ACC GCC ACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TC AAC CC AC GGAAGC C AC G GGAAT GGC GGC C AGGC AC T C GGAT C T T GAC GT C C C CAT C C A 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG T C TG AT GGAGGGAAGGGGC T T GAAC AGGGC C T C AGGG GAGC AGAGGGAG GGC C C T AC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGG T C TG AT GGAGGGAAGGGGC T T GAAC AGGGC C T C AGGGGAGC AGAGGGAGGGC C C T AC 2040 

Qy 2041 TGC GAGATGAGGGAGGC C T C AGAGGAC C C AGC AC C C T AGGAC AC C GC AC CCCTGTCT GAG 2100 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I 
Db 2041 TGC GAGAT GAGGGAG GC C T CAGAGGAC C C AGC AC C C TAGGAC AC C GC AC C C C T G T C TGAG 2100 

Qy 2101 AC T GAGGC TGCCAC T TC TGGCC TC AAGAATCAGAAC GATGGGGAC TCAGATT GCAT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 ACT GAGGC TGCCAC T TC TGGCC TC AAGAATCAGAAC GATGGGGAC TCAGATT GCAT GGGG 2160 

Qy 2161 GT GGGAC C C AG GC C T GC AAGGC T T ACGC GGAGGAAG AGGAGGGAGGAC T C AGGGGAC C T T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GT G GGAC C C AGGC C T GC AAGGC T T ACGC GGAGGAAG AGGAGGGAGGAC T C AGGGGACC T T 2220 

Qy 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

I I I I I I I I I I 1 I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAAT CC AGAT C AG T GTGGACC TC GGC C C T GAGAGGTC C AGGGC ACGG T GGC C AC AT AT G 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I 
Db 2281 GCC CATATT TCC TGC ATC TTTGAGGTGAC AGGAC AG AGC TGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TCAGGTC AACAGAGGGAGGAGTTC CAGGATCC ATATGGCC CAAGATGTGCCC CC T TCATG 2400 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 
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AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 24 60 

I I I II I I I I I I I II I I I I I I I I I I I I I I I I I 1 I I I I I I I II I I I I I I I I I I I I I I I I I I I 
AGGAC TG GGGAT AT C C C C GGC T C AGAAAGAAGGGAC TCC AC AC AGTC T GGC TGTCCCCTT 24 60 


Qy 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db- 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2 520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T C ATG TC AGGGAAT T GGGGGT T GAGGAAGC AC AGGCGC T GGC AGGAATAAAGAT GAG T 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 2581 AC T C ATG TC AGGGAAT T GGGGG T T GAGGAAGC AC AGGC GC TGGC AGGAATAAAGAT GAGT 2 640 

Qy 2641 GAGAC AGAC AAGGC T AT TGGAATC C AC AC C CC AGAAC C AAAGGGGTC AGC C C TGGAC AC C 2700 

I I I I I I I I I I I I I I I i I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GAG AC AGAC AAGGC TAT T GGAATC C AC AC C CC AGAAC C AAAGGGGT C AGC C C TGGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 CAT T C T C AG AG GGT GAC T C AGGTC AAC GT AGGGAC C CC C AT C T GGT C T AAAGAC AGAGC G 2820 

Qy 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

Qy 2881 GAC C AGAAC AC TGAGGGAGAC TGC ACAGAAAT C AGC CC TGCCCC TGC T GTCACCC C AGAG 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I II I I I I I I I I I I I I I I I 
Db 2881 GAC C AGAAC AC T GAGGGAGAC T GC AC AGAAAT C AGC CC T GC C C C TGC T GTC AC C C C AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I M I I II I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 AC GGGGAGGC C T TGGTC T GAGAAGGC T GC GC T C AGG TC AGTAGAGGGAGC GT C C C AGGCC 3060 

Qy 3061 C TGC C AGGAGT C AAGGT GAGGAC C AAGC GGGC AC C T C AC C C AGGAC AC AT T AAT T C CAAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 C TGCCAGGAGT CAAGGTGAGGACC AAGC GGGC ACC T CACCCAGGACAC AT TAAT TC CAAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 AC C AGC AAAAGGGC AGGAT C C AGGC CC T GCC AGGAAAAAT ATAAGGGC C C TG C GT GAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

Qy 3301 C AGAGGGGGT C AT C C AC TGC AT GAGAGT GGGG ATGT C AC AGAGT C C AGC C C AC C C T C C T G 3360 


Qy 

Db 


2401 
2401 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II t I I I I I I I I I I II I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 C T T C C TGGAGC T C C AGGAAC CAGGC AGT GAGGC C T TGGTC TGAGAC AG T ATC C T C AGGT C 3480 

Qy 3481 ACAGAGC AGAGGATGCACAGGGTGTGCC AGCAGTGAATGT T TGC CC TGAATGCACACCAA 3540 

I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 3481 AC AGAGC AGAGGATGC AC AGGGTG TGC C AGCAGT GAAT GT T T GC C C TGAAT GC AC ACC AA 3540 

Qy 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 C C T T C AGGT T T T C AGGGGAC AGGC C AAC C C AGAGGAC AGG AT T C C C TGGAGGC C AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 CC T T C AGGT T T T C AGGGGAC AGGC C AAC C C AGAGGAC AGGAT T C C C TGGAGGC C AC AGAG 3720 

Qy 3721 GAGC AC C AAGGAGAAGATC T GT AAGT AGGC C T T T GT TAGAGT C T C C AAGGT T C AGT TC T C 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGC AC C AAGGAGAAGATC T GT AAG T AGGC C T T TGT TAGAGTC T C C AAGG T T C AGT TC T C 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C C AC AC T C C T GCC T GC TGC C C T GAC GAGAGT C ATC AT GTC T C T T GAGC AGAGGAG 3900 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 C C T GC C C AC AC T C C T GC C T GC TGC C C T GAC GAGAGT CAT CAT GT C T C T TGAGC AGAGGAG 3900 

Qy 3901 T C T GC AC T GC AAGC C T GAG GAAGC CC T T GAGGC C CAAC AAGAGGC C C T GGGC C T GG TGT G 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 T C T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C CAAC AAGAGGC C C T GGGC CTGGTGTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 C AC T GC T GGGT C AAC AGAT C C T C C CC AGAGTC C T C AGGGAGC C TC C GC C T T T C C C AC T AC 4080 

I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 4021 C AC TGC T GGG T CAAC AGAT C C T C C C C AGAGTC C T C AGGGAGC CTCCGCCTTTCC C AC T AC 4080 

Qy 4081 CAT CAAC T T C AC T C GAC AG AGGC AAC C C AGT G AGGG T T C C AGC AGC C G T GAAG AGG AGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CATCAACTTCACTCGACAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGG 4140 

Qy 4141 GCC AAGC ACC TCTTGTATCCTGGAGTCCT TGT TCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGT TCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AAT GC T GGAGAGTGT C ATC AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC 4 320 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AAT GC T GGAGAGTG T C AT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T TC GGC AAAGC 4 320 

Qy 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4 380 

I I I I I I I I I I I I I I I I I M I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4 380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4 4 41 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

Qy 4 501 CCATGC T CC TGAGGAGGAAATC TGGGAGGAGC TGAGTGTGATGGAGGT GTAT GATGGGAG 4 560 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 
Db 4501 CCATGC TCC TGAGGAGGAAATC TGGGAGGAGC TGAGTGTGATGGAGGT GTAT GATGGGAG 4560 

Qy 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 4561 GGAGCAC AGTGCC TATGGGGAGCC CAGGAAGC TGC TC ACC CAAGAT T TGGTGCAGGAAAA 4620 

Qy 4 621 GTAC C T G GAGT AC GGC AGG T GC CGGAC AGT GAT CC C GC AC GC T ATGAG T T C C TGT GGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4681 CC AAGGG C C C T C GC TGAAAC C AGC TATG TGAAAGT C C T T GAGT ATGT GAT C AAGGT C AGT 4740 

Qy 4741 GC AAGAG TTCGCTTTTTCT T CC C AT C C C T GC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 4 741 GC AAGAG TTCGCTTTTTCT TC CC ATC C C TGC G T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 
Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

Qy 4 921 GAAGAGAGC GGT C AG T GT T C TC AG T AGT AGGT T TC T GT T C TAT T GGG T GAC T T GGAGAT T 4 980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 921 GAAGAGAGC GG TC AG T GT T C T C AG TAGT AGGT T TC T GT T C TAT T GGGTGAC T TGGAGAT T 4 980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I 1 I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 
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Qy 5161 AAC AGCAGTGGAATAAGTAC TTAGAAAT GTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGCAGTGGAATAAGTAC TTAGAAAT GTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

Qy 5221 AGAAC TAAAGAAATT AAGAGATAGTCAAT TCT TGC C TTAT ACC TCAGTC TAT TC TGTAAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC TAAAGAAATTAAGAGATAGTCAAT TCT TGC C TTAT ACC T CAGTC TAT TC TGTAAA 5280 

Qy 5281 AT T T T T AAAGATATATGC AT AC CT GGAT T TCC T T GGC T T C T T T GAGAAT GT AAGAGAAAT 5340 

I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T T AAAGATATATGC AT AC CT GGAT T TCC T T GGC T T C T T T GAGAAT GT AAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 01 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C T AAAGAT G T AGGGAAAAGT GAGAGAGGGG T GAGGGTG TGGGGC TCC GGG T GAGAGT G 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C TC T AAAGAT G T AGGGAAAAGT GAGAGAGGGG T GAGGGT G T GGG GC TCC GGG T GAGAGT G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAG C TGATTGT AAT GAT C TT GGGT GGAT C C 5 674 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGG GGAGC T GAT T GT AAT GAT C T T GGGT GGAT C C 5 674 


RESULT 2 
AR153499 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
FEATURES 

source 


ORIGIN 


linear PAT 08-AUG-2001 


AR153499 5674 bp DNA 

Sequence 8 from patent US 6235525. 
AR153499 

AR153 4 99.1 GI: 15121031 


Unknown. 

Unknown . 

Unclassified. 

1 (bases 1 to 5674) 

van den Eynde,B., van der Bruggen, P. and Boon-Falleur, T . 
Isolated nucleic acid molecules coding for tumor rejection antigen 
precursor MAGE- 3 and uses thereof 
Patent: US 6235525-A 8 22-MAY-2001; 

Location/Qualifiers 

1. .5674 

/organism="unknown" 
/mol_type=" una s signed DNA" 


Query Match 100.0%; 
Best Local Similarity 100.0%; 


Score 5 674; DB 2; 
Pred. No. 0; 


Length 5674; 
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Matches 5674; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 


Qy 

1 

CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 

60 


I | | | | | | | | 1 1 1 1 1 I 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 


Db 

1 

r~TT , r^r^r^r , r , 7\r % r' t\ r* T»r* m 7\ t ppr TP pp P P T 71 P P TS.C C C C C 71 n TP PP TP PP TTTZXPH-PP ZXPPP 

60 

Qy 

61 

ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 

120 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 > 1 


Db 

61 

ATCCAAACATCTTCACGC lCACCCCCAGCCCAAtjUUAb-b^AljAAlL.^ijVjl h^/v-^l,^ itr 


Qy 

121 

C T C T C AAC CC AGGGAAGC C C AGGT GC C C AGAT GTGAC GCC AC TG AC T T GAGC AT T AGTGG 

180 


I I I I 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

121 

CTCTCAACCCAGGGAAGCCCAGGTGCCCAGAIGIGACGCUAL. IbAU 1 HjA(j^a± ia^jIVjIj 

i fin 

lOU 

Qy 

181 

T TAGAGAGAAGC GAGGT T T TC GGT C T GAGGGGC GGC T T GAGAT C GGT GGAGGGAAGC GGG 

240 


I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

181 

T TAGAGAGAAGC GAGGT T T TC GGT C TGAGGGGC GGC 1 1 (jA(jA i U (jvj 1 CjtxAvjiaoAAijU vjtjij 

? 4 D 

c. H \J 

Qy 

241 

C C C AGC T C TGT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC TGAGGAC C C AC T TAC C C C 

300 


I I 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

241 

~ f~, ^ -r\ r~* r-< m m mTvT\/^/^Tv/^/^^7\7\/^r^rp/^7\/^7\rTi/^r^ 

CCCAGC TC TGT AAGGAGGC AAGGT GAC A I 1 GAGCjCjAIjCjAU I^AWjAUL-UAL. 1 1 A^^^u 

O KJ \J 

Qy 

301 

AGATAGAGGAC CC CAAAT AAT C C C T T C ATGCC AGT C C T GG ACC AT C T GGTGG TGGAC T T C 

360 


I | | 1 1 [ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 


Db 

301 

AGATAGAGGAC C C CAAAT AAT CCCTTCAT GC C AG T C C I GG AC C A 1 C 1 G G 1 G<j I CjCjAU lit 

JDU 

Qy 

361 

TC AGGC T GGGC C AC C C C C AGC CCCCTTGCT GC T T AAAC C AC TGGGGAC TC GAAGT C AGAG 

420 


1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 


Db 

361 

TCAGGCTGGGC CACCCCCAGCCCCCTTGCTGCTTAAACCAC TGGGGAC TCGAAGTC AGAG 


Qy 

421 

CTCCGTGT GAT C AGG GAAGGGC T G C T T AGGAG AGGG CAGC GTC C AGGC T C T GC C AGAC AT 

480 


I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

421 

CTCCGTGT GAT C AGGGAAG GGC TGC T T AGGAG AGGGC AGC GTC C AGGC T C I G C C AGAC A 1 

/ton 

Qy 

481 

CAT GC T C AGGAT T C T C AAGGAGGG C TGAGGGT C CC T AAGAC C C C AC TC C C GT GAC C C AAC 

540 


I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

481 

C AT GCTCAGGATTCTCAAGGAGGGC TGAGGGT CCCTAAGACCCC AC 1CCLG1 CjACUUAAt 

r a n 

0 H u 

Qy 

541 

CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 

600 


I II | 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

541 

CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCC IC I ICAi 1 LilUAl lLtARLLLLLA 


Qy 

601 

CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 

660 


I I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

601 

CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCAlCCGCCOAtjUUAl 

DDU 

Qy 

661 

CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 

720 


M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 


Db 

661 

CACCCCCACCCCCACCCCCACGCCCAC 1 L L L AL L L L L AL L L AbljL Ablj A 1 1 L bij 1 1 

170 

Qy 

721 

CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 

780 


1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 I 1 


Db 

721 

r*r»7\r , r- , 7\7\7\r'7\ n^r'/^r*f~*/™•^^/-•^ , f~ , f~ , ^ , ^ , 7\ T<f~*TP 7APPPP7APTf27AP r rTf2PfIiP TATTfZTfZf^fifiP rAf^nP^Zi 

780 

Qy 

781 

GAAGCGAGGTTTCCATTCTGAGGGACGGCGTAGAGTTCGGCCGAAGGAACC 1 bAUtUAtjlj 

q a n 

O 4 U 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

781 

GAAGC GAGGT T T CC AT T C T GAGGGAC GGCGT AGAGT T C GGC C GAAGGAAC C T GAC C C AGG 

840 

Qy 

841 

C TC TGTGAGGAGGC AAGGT GAGAGGC T GAGGGAGGAC TGAGGAC CCCGCC AC TCCAAATA 

900 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

841 

C TC TGT GAGGAGGC AAGGT GAGAGGC T GAGGGAGGAC T GAGGAC C C C GC C AC T C CAAAT A 

900 
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GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 


Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I 
Db 961 C GT C TCAGC C T GGGC TGC C C CC AGACCC C TGC T C CAAAAGCC T T GAGAGAC AC C AG GT T C 1020 

Qy 1021 TTCTCCCCAAGCTCTGGAATCAGAGGTTGCTGTGACCAGGGCAGGACTGGTTAGGAGAGG 1080 

I | | | I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 1021 T TC T C C C C AAGC T C TGGAAT CAGAGGT TGC TG T GAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GC AGGGC AC AGGCTC TGC CAGGCATCAAGATCAGC AC CCAAGAGGGAGGGCTGT GGGC CC 1140 

I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy H41 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I M 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 12 60 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I | | | | | | | I I [ [ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 T GAAC C T C AC AGATC T GAGAGAAGC C AG GT TC AT T T AATGGT TC TGAGGGGCGGC T T GAG 1500 

I | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T GAACC T C AC AGAT C TGAGAGAAGC C AGGT TC AT T T AAT GGT T C T GAGGGGC GGC T T GAG 1500 

Qy 1501 AT C C AC T GAGGGGAG T GG T T T TAGGC T C T GTGAGGAGGC AAGG TGAGAT GC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 ATC CAC T GAGGGGAG TGGT T T T AGGC TC TG TGAGGAGGC AAGGT GAGAT GC TGAGG GAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAATGATC C AGT AC CAC C C C T GC TG 1620 

I | | | | | | | I I [ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I M I I I I I 
Db 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAATG AT C C AGT AC CAC C C C T GC T G 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTC TCAGC TGGACCACCCCCCGTCCCGTCC 1680 

I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 C C AGCC C T GGAC CAC C C GGC C AGGAC AG ATGT C TCAGC TGGAC C AC CCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I II I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II 
Db 1741 GGT C AGGAG AGGC AGGGC CC AGGC ATC AAGGT CCAGC ATC CGCCCGGC AT TAGGGTCAGG 1800 


Qy 

Db 


901 
901 
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Qy 1801 ACC C T GGGAGGGAAC T GAGGGT T C CC C AC C CAC AC CTGTCTCCT CATC T C C AC C GC C AC C 1860 

I | | | I I I I I I II I I II I I I i I I I I I I I I I I I I I I I I I I I M M I t II I I I I I I I I II I I I 
Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG T C TG ATGGAGGGAAGGGGC T T GAAC AGGGC C T C AGGGGAGC AGAGGGAGGGCC C TAC 2040 

I | | || | | | | | | I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGG T C TGAT GGAGGGAAGGGGC T T GAAC AGGGC C TC AGGGGAGC AGAGGGAGGGC C C TAC 2040 

Qy 2041 TGC GAGAT GAGGGAGGCC T C AGAG GAC C C AGC AC C C T AGGAC AC C GC AC CC C T G TC T GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 TGCGAGATGAGGGAGGCCTCAGAGGACCCAGCACCC TAGGACAC CGCACCCC TGTC TGAG 2100 

Qy 2101 AC T GAGGC TGC CAC T T C T GGC C TC AAGAAT C AGAAC GATGGGGAC T CAGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC TGAGGC TGC CAC T TC TGGCC TCAAGAATC AGAAC GATGGGGAC TCAGAT T GC AT GGGG 2160 

Qy 2161 GT GGGAC C C AG GC C T GC AAGGC T TAC GC GGAG GAAG AGGAGGGAGGAC T C AGGGGAC C T T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GTGGGAC C C AGGC C T GC AAGGC T TAC GC GGAGGAAG AGGAGGGAGGAC TC AGGGGAC C T T 2220 

Qy 2221 GGAAT C CAGAT C AGT GT GGACC T C GGCC C T GAGAGG T C C AGGGC AC GG T GGC CAC AT AT G 2280 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2221 GGAAT C CAGAT C AGT GT GGAC C TC GGC C C T GAGAGG T C C AGGGC AC GGT GGC C ACAT AT G 2280 

Qy 2281 GC C CAT AT T T C C T GC AT C T T TGAGGT GAC AGGAC AG AGC T G TGG TC T GAGAAGTGGGGC C 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TC AGGT C AAC AGAGGGAGGAGT TC C AGGAT CC AT AT GGC C C AAGATGT GC C C C C T T C AT G 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 TC AGGT C AAC AGAGGGAGGAGT TC CAGG AT CC ATAT GGC C C AAGAT GT GC C C C C T TC AT G 2400 

Qy 2401 AGGAC T GGGGATATC C C C GGC T C AGAAAGAAGGGAC T C CAC AC AGT C T GGC TGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 2401 AGGAC T GGGGAT AT C C C C GGC T C AGAAAGAAGGGAC T C CAC AC AGTC T GGC TGTCCCCTT 2460 

Qy 2461 T T AGTAGC T C T AGGGGGAC CAGAT C AGGGAT GGCGG TAT G T T C C AT TC T CAC T T GT AC C A 2520 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I 
Db 24 61 T T AGT AGC T C T AGGGGGAC CAGAT C AGGGAT GGCGG TAT G T T C C AT TC T CAC T T GT AC C A 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 C AGGC AGGAAGTTGGGGGGCCCTCAGGGAGAT GGGG TCTT GGGG TAAAGGGGGGATGTCT 2580 

Qy 2581 AC T CAT G TC AGGGAAT TGGGGGT T GAGGAAGC AC AGGC GC T GGC AGGAAT AAAGAT GAGT 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 ACT CAT GTC AGGGAAT TGGGGGT T GAGGAAGC AC AGGC GCTGGC AGGAAT AAAGAT GAGT 2640 

Qy 2641 GAGAC AGAC AAGGC T AT TGGAAT C CAC ACC C C AGAAC C AAAGGG GT C AGC CC T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 1 I I I I I I I I I I I I I I I I I I 
Db 2641 GAGAC AGAC AAGGC TAT TGGAATC CAC ACC C C AGAAC C AAAGGGG T C AGC CC T GGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

2701 

TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 

2760 

Qy 

2761 

CATTCTCAGAGGGTGACTCAGGTCAACG lAGGbACCCCUAlL. IIjLjIL, 1 AAR^AL-^vLtALxUvj 

c. O £ U 


i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i > i i i i i i i i i i i i i i i i i 


Db 

2761 

CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 

2820 

Qy 

2821 

GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGAC ItjAGCrb I ACCOLAIj 



I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 


Db 

2821 

GTC C C AGGAT C TGC C AT GC G T T C GGGT GAGGAACAT GAGG GAGGAC T GAGGG TAC C CC AG 

2880 

Qy 

2881 

GAC C AGAACAC TGAGGGAGAC TGC ACAGAAAT CAGC CC TGCCCC TGCT GTC ACCCC AGAG 

O Q a n 

z y h u 


1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 E 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 


Db 

2881 

GAC CAGAACAC TGAGGGAGAC TGC ACAGAAAT CAGC CC TGCCCC TGC T GTCACCCC AGAG 

2940 

Qy 

2941 

AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 

oUUU 


1 | 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

2941 

AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 

3000 

Qy 

3001 

ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 

o n c f\ 


I | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 II 1 M 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3001 

AC GGGGAGGC C T TGGT C T GAGAAGGC TGC GC T C AGG T C AG T AGAGGGAGC GT C C C AGGC C 

3060 

Qy 

3061 

CTGCCAGGAGT CAAGGTGAGGACC AAGC GGGC ACC TC ACC CAGGACAC AT TAATTCCAAT 

olZU 


i I I 1 I 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 II 1 1 1 1 1 


Db 

3061 

CTGCCAGGAGT CAAGGTGAGGACC AAGC GGGC ACC T CACC CAGGACAC AT TAAT TCCAAT 

3120 

Qy 

3121 

GAAT T T T GAT AT C T C T T GC T GC C C T T C C C C AAGGAC C T AGGC AC G T GT GGC C AGAT G T T T 

o i o n 
JloU 


I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3121 

GAATT T T GAT AT C T C T TGC T GC C C T TC C C C AAGGAC C TAGGC AC GT GT GGC C AGAT GT T T 

3180 

Qy 

3181 

GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 

oZ4U 


1 I 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3181 

GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 

3240 

Qy 

3241 

AC C AGC AAAAG GGC AGGAT C C AGGC CC T GC C AGGAAAAAT AT AAGGGC C C T GC G T G AGAA 

ooUU 


I 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3241 

ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 

3300 

Qy 

3301 

C AGAGGGGGT C ATC C AC T GC AT GAGAGT GGGGAT GT C AC AGAGT C C AGCC C AC C C T C C TG 

o o c n 
6 6 bU 


I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3301 

C AGAGGGGGT CAT C C AC TG C AT GAGAGT GGGGAT GT CAC AGAGT C CAGC C C AC C C T C C TG 

3360 

Qy 

3361 

GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 



I | | | | | | [ 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 


Db 

3361 

GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 

3420 

Qy 

3421 

C T T C C T GGAGC T CC AGGAAC C AGGC AGT GAGGC C T T GGT C T GAG AC AG T ATC C TC AGGT C 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i 


Db 

3421 

CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 

3480 

Qy 

3481 

ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCC 1 fcrAAl QrUAUALLAA 



I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 


Db 

3481 

AC AGAGC AGAGGAT GC AC AGGG T G T GC CAGC AGT GAATGT T T GC C C T GAATGC AC AC C AA 

3540 

Qy 

3541 

GGG C C C C AC C T GC C AC AGGAC AC ATAGGAC T C CAC AGAG TC T GGC C T C AC C T C CC T AC T G 

3600 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 II 1 


Db 

3541 

GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 

3600 

Qy 

3601 

TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 

3660 


1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
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Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T TCAGGTT T TCAGGGGACAGGC CAAC CCAGAGGACAGGATTC CC TGGAGGCCAC AGAG 3720 

I I I I I I M I t I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I E I I I I I I I I I I I I I I I 
Db 3661 CC T TC AG G T T T T C AGGGGAC AGGC CAAC C C AGAGGAC AGGAT T C CC TGGAGGC C AC AGAG 3720 

Qy 3721 GAG C AC C AAGGAGAAGAT C TGT AAGT AGGC C T T TGT TAGAGT C T C C AAGGT T C AGT TC T C 3780 

I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGCACC AAGGAGAAGAT C T GTAAGT AGGC C T T TGT T AGAGT C T CC AAGGT T C AG T T C T C 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 38 41 CC T GC C C AC AC TCCTGCCTGCTGCCC TGAC GAGAGT C AT C AT GT C T C T TGAGC AGAGGAG 3900 

I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 CC T GC C C AC AC TCCTGCCTGCTGCCC TGAC GAGAGT C AT C ATGT C TC T T GAGC AGAGGAG 3900 

Qy 3901 TC T GC AC T GC AAGC C T GAGGAAGC CC T T GAGGC CCAAC AAGAGG CC C T GGGC CTGGTGTG 3960 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I 
Db 3901 TC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC CCAAC AAGAGGCC C T GGGC C T GG T GTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 C AC TGC T GGGT C AAC AGAT C C T C C C C AGAGT C C T C AGGGAGC CTCCGCCTTTC C C AC T AC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I II I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

Qy 4081 CAT CAAC T TC AC TC GAC AGAGGC AACC C AGT GAGGG T T C C AGC AGC C G T GAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I IE 
Db 4081 CAT CAAC T T C AC T C GAC AGAGGC AACC C AGT GAGGG T T C C AGC AGC C G TGAAGAGG AGGG 4140 

Qy 4141 GC C AAGC AC C T C T T G T ATC C T GGAGTC C T T G T T C C GAGC AG TAAT C AC T AAGAAGG T GGC 4200 

I | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GC C AAGC AC C T C T T G TATC C TGGAGTC C T T GT T C C GAGC AGT AAT C AC TAAGAAGG T GGC 4200 

Qy 4201 TGAT T T GGT TGGTTTTCTGCTCCT C AAAT AT C GAGC C AGGGAGC C AGT C AC AAAGGC AGA 42 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4201 TGAT TTGGTTGGTTTTC TGC TCCTCAAAT ATC GAGC C AGGGAGC CAGTCACAAAGGCAGA 4260 

Qy 4261 AAT GC T GGAGAGT GT C AT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T TC GGCAAAGC 4320 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 42 61 AATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4321 C T C T GAG T C C T TGC AGC T G GTC T T T GGC AT T GAC GT GAAGGAAGC AGAC C C C ACC GGC C A 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 44 41 GAT CAT G C C C AAGAC AGGC T TC C T GAT AAT T GT C C T GGT CAT GAT T GC AAT GGAGGGC GG 4500 

I I I I I I I I I I I I I I I I I I II I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GATCATGCCCAAGAC AGGC TTCC TGAT AATTGTCCTGGTCATGAT TGC AATGGAGGGCGG 4500 

Qy 4501 C C ATGC T C C T GAGGAGGAAATC TGGGAGGAGC TGAG TGT GAT GGAGGT GTAT GATG GGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 1 I I I I I I I I I I 
Db 4501 C C AT GC T C C TGAGGAGGAAATC TGGGAGGAGC T GAG T GT GATGGAGGT GTAT GATGGGAG 4560 
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GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I 
GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 


Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I M I I II II I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 4741 GC AAGAG TTCGCTTTTTCTTCC CAT C C C T GCGT GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4741 GC AAGAG T T C GC TTTTTCTTCC CAT C C C T GCG T GAAGC AG C T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 48 60 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4 921 GAAGAGAGC GG TC AG TGT T C TC AG T AGT AGGT T TC T GT TC TAT T GGGT GAC T T GGAGAT T 4 980 

I | || I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGC GG TC AGT GT T C T C AG T AGT AGGT T TC T GT T C TAT T GGGT GAC T T GGAGAT T 4 980 

Qy 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy '5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 T AAGAGT CTTGTGTTT TAT T C AGAT T GGGAAAT C CAT T C TAT T T TGT GAAT T GGGAT AAT 5160 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 5101 T AAGAGT C TTGTGTTT TAT T C AGAT T GG GAAAT C C AT TC TAT T T T GTGAAT T GGGAT AAT 5160 

Qy 5161 AAC AGCAGTGGAATAAGTAC TTAGAAAT GTGAAAAATGAGCAGT AAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AG TGGAAT AAGTAC T TAGAAAT GT GAAAAAT GAGC AGT AAAAT AGAT GAG AT AA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AAT T C T T GC C T TAT AC C T C AGT C TAT T C T G T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AAT T C T T GC C T TAT AC C T C AGT C TAT TC TG TAAA 5280 

Qy 5281 AT T T T T AAAGAT AT AT GC AT AC C T GGAT TTCCTTGGCTTCTTT GAG AATG T AAGAG AAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 5281 AT T T T T AAAGAT AT ATGC AT ACC T GGAT T TC C T TGG C T T C T T TG AGAAT GTAAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II 

Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 


Qy 4561 
Db 4561 
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Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I 1 I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I t I I I I I I I I I I I I 1 I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGC TGAT TGT AATGATC T T GGGT GGAT CC 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGC TGAT TGTAATGATCTT GGGT GGAT CC 5 674 
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124013 
Sequence 
124013 
124013.1 


5674 bp DNA 
1 from patent US 5541104. 

GI:1603883 


linear PAT 07-OCT-1996 


Rettig,W.J., van 


Unknown . 
Unknown . 
Unclassified . 
1 (bases 1 to 5674) 

Chen, Y.-T., Stockert,E., Chen,Y., Garin-Chesa , P . 
der Bruggen,P., Boon-Falleur, T . and Old, L.J. 
Monoclonal antibodies which bind to tumor rejection antigen 
precursor mage-1 

Patent: US 5541104-A 1 30-JUL-1996; 
Location/Qualifiers 
1. .5674 

/organism= "unknown" 
/mol_type="unassigned DNA" 


Query Match 100.0%; Score 5674; DB 2; Length 5674; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5674; Conservative 0; Mismatches 0; Indels 0; 


Gaps 


Qy 

Db 


CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 


Qy 

Db 

Qy 

Db 


61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 C T C TC AAC C C AGGGAAGC C C AGGT GCC C AGAT GT GAC GC C AC TG AC T T GAGC AT T AGT GG 180 


Qy 


Db 


181 T T AGAGAGAAGC GAGG T T T T CGGT C T GAGGGGC GGC T T GAGAT C GGT GGAGGGAAGC GGG 240 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 
181 T TAGAGAGAAGC GAGGT T T T C GGT C TGAGGGGC GGC T TGAGAT C GGT GGAGGGAAGC GGG 240 


Qy 


241 CCCAGCTCTGTAAGGAGGCAAGGTGACATGCTGAGGGAGGACTGAGGACCCACTTACCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 


300 
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Db 241 CC C AGC T C TGT AAGG AGGC AAGGT GACAT GC T GAGGGAGGAC TG AGGAC C C AC T T ACC C C 300 

Qy 301 AGATAGAGGAC C C C AAATAATC C C T TC AT GCC AGTC C T GGAC CAT C T GGTGG TGGAC T TC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I i I I I I I I I I I I I I I I I 
Db 301 AGATAGAGGAC C C C AAATAATC C C T TCATGCC AGT C C T GGAC CAT C T GGTGG TGGAC T TC 360 

Qy 361 TC AGGC T GGGC C ACC C CC AGC CCCCTTGCTGCT T AAAC C AC T GG GGAC TC GAAG T C AGAG 420 

I I I I I I I M II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 T C AGGC T GGGC C ACC C CC AGCC C CCTTGCTGCT T AAAC C AC T GGGGAC TC GAAGT C AGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CAT GC T C AGGAT TC T C AAGGAGGGC TGAGGGT C CC T AAGAC C CC AC TC CC GT GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

j I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 C C AGGAAAC AT CCGGGTGCCC GGAT G T GAC GC C AC T GAC T T GC G C AT T G T GG GGC AGAGA 78 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACT GAC TTGCGCATTGTGGGGC AGAGA 780 

Qy 781 GAAGC GAGG T T T C CAT T C T GAGGGAC GGC GT AGAGT T C GGC C GAAGGAAC C T GAC C C AGG 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGGT T T C CAT TC T GAGGGAC GGCGT AGAGT T C GGC C GAAGGAAC C TGAC C C AGG 840 

Qy 841 C T C TGT GAGGAGGC AAGGT GAGAGGC TGAGGGAGGAC TGAGGAC C C C GCC AC T C C AAAT A 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 C TC TGTGAGGAGGCAAGGT GAGAGGC TGAGGGAGGAC TGAGGAC CCCGCCACTCCAAAT A 900 

Qy 901 GAG AGC C C C AAAT AT TC C AGC CCCGCCCTTGCT GC C AGC C C T GGC C C AC C C GC GGG AAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

Qy 1021 T T C T C C C C AAG C TC T GGAATC AGAGGT T GC T G TGAC CAGGGC AGGAC T GG T T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 T T C TC CC C AAGC TC T GGAAT C AGAGGT T GC TG T GAC C AGG GC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GC AGGGC AC AGGC TCTGCC AGGC ATCAAGATC AGC AC CCAAGAGGGAGGGC TGT GGGC CC 1140 

I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GC AGGGC ACAGGC TCTGCC AGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I II I 1 I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 
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Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I 

Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGT T TGC CCCTGCTCT C AAC C C AGGGAAGC C C T GGT AGGC C C GAT GTGAAAC C AC T GAC T 1440 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I 

Db 1381 GGT T TGC CCC TGC TCTCAACCCAGGGAAGCCCTGGT AGGC CCGATGTGAAACCACTGACT 1440 

Qy 14 41 T GAAC C T C AC AGAT C T GAGAGAAGC C AGGT T C AT T T AAT GGT T C TGAGGGGC GGC T TGAG 1500 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 14 41 T GAAC C T C AC AGAT C T GAGAGAAGC C AGGT T C AT T T AATGGT T C T GAGGGGC GGC T TGAG 1500 

Qy 1501 ATC CAC TGAGGGGAG TGGT TTTAGGC TC TGTGAGGAGGCAAGGT GAGATGC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I 

Db 1501 ATC CAC T GAGGGGAG TGGT TTTAGGC TC TGTGAGGAGGCAAGGTGAGATGC T GAGGGAGG 1560 

Qy 1561 AC T GAGG AGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT C C AGT AC CAC C C C T GC T G 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AC T GAGG AGGC AC AC AC C C C AGGT AGAT GGC C C CAAAAT GAT C C AGTAC C AC CC C T GC T G 1620 

Qy 1621 C C AGC C C TGGACC AC C C GGC CAGGAC AGAT GT C T C AGC TGGAC C ACCC CCCGTCCC GT C C 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG T C T GAT GGAGGGAAGGGGC T T GAAC AGGGC C T C AGGGGAGC AGAGGGAGGGC C C T AC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GGG TC TG AT GGAGGGAAGGGGC TT GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGC C CTAC 2040 

Qy 2041 TGC GAGATGAGGGAGGCC TCAGAGGACCCAGC ACCC TAGGACAC CGCACCCC TGTC TGAG 2100 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I 

Db 2041 T GC GAGAT GAG GGAGGC C T C AGAGGAC C C AGC AC C C TAGGACAC C GC AC CC C TGTC TGAG 2100 
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Qy 2101 AC T GAGGC TGC CAC T T C TGGCC TC AAGAAT C AGAAC GAT GGGGAC TC AGAT T GC AT GGGG 2160 

I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 2101 AC T GAGGC TGC CAC T T C TGGCC TC AAGAAT C AGAAC GAT GGGGAC TC AGAT T GC AT GGGG 2160 

Qy 2161 GTGGGAC CC AGGCC TGCAAGGC TTACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGACC T T 2220 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 GT GGGAC C C AGGC C T GC AAGGC TT AC GC GGAGGAAGAGGAGGGAGGAC TC AGGGGAC C T T 2220 

Qy 2221 GGAAT C C AGAT C AGT GTGGACC TC GGC C C T GAGAGG TCC AGGGC AC GG T GGC CAC AT AT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2221 GGAAT C C AGAT C AGT GT GG ACC TC GGC C C T GAGAGG TCC AGGGC AC GG T GGC CAC AT AT G 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TCAGGT C AAC AGAGGGAGGAGT TC C AGGAT C CAT AT GGC C C AAGATGT GC CC C C T T C AT G 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 TC AGG T C AAC AGAGGGAGGAGT TC C AGGAT C CAT AT GGC C C AAGATGT GC C C C C T T CAT G 2400 

Qy 2401 AGG AC T GGGGAT AT C C C C G GC TC AGAAAGAAGGGAC TCC AC AC AG TC T GGC TGTCCCCTT 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGGAC T G GGGAT AT C C C CGGC TC AGAAAGAAGGGAC T CC AC AC AGTC T GGC TGTCCCCTT 24 60 

Qy 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 T TAGT AGC T C T AGGGGGAC C AGAT C AGGGAT GGC GG TAT G T T C CAT T C T CAC T T GT AC CA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T CATGTCAGGGAAT TGGGGGTT GAGGAAGC ACAGGCGC TGGC AGGAATAAAGAT GAGT 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AC TCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGC TGGC AGGAATAAAGAT GAGT 2640 

Qy 2641 GAGAC AGAC AAGGC T ATT GGAATC C AC AC C C C AGAAC C AAAGGGGT C AGC C C T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GAGAC AGAC AAGGC T ATT GGAATC CAC AC C C C AGAAC C AAAGGGGT C AGC C C T GGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

Qy 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GT C C C AGGAT C T GC C ATGC GT T CGGGTGAGGAAC AT GAGGGAGGAC T GAGGG TAC C CC AG 2880 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 GTC C C AGGAT C TGC C ATGC GT TCGGGTGAGGAAC AT GAGG GAGGAC TG AGGG TAC C C C AG 2880 

Qy 2881 GAC C AGAAC AC T GAGGGAGAC TGC AC AGAAAT C AGC CCTGCCCCTGCT GTC AC C C C AGAG 2940 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GAC C AGAAC AC T GAGGGAGAC TGC AC AGAAAT C AGC CCTGCCCCTGC T GT CAC CC C AGAG 2940 

Qy 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 
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II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 

Db 3001 AC GGGGAGGC C T TGG T C TGAGAAGGC T GCGC T C AGG TC AG T AGAGGGAGC GT C C C AGGC C 3060 

Qy 3061 C T GC C AGGAGT C AAGGTGAGGACC AAGC GGGC AC C T C AC C C AGGAC AC AT TAAT TC C AAT 3120 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3061 C T GC C AGGAGT C AAGGTGAGGACC AAGC GGGC ACC T C AC C C AGGAC AC AT T AAT TC C AAT 3120 

Qy 3121 GAAT T T TGATAT CTCTTGCTGCCC T TC C CC AAGGAC C TAGGC AC G TGT GGCC AGAT GT T T 3180 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 AC C AGC AAAAG GGC AGGAT C C AGGC C C T GC C AGGAAAAAT AT AAGGGC C C TGC GTG AGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 AC C AGC AAAAGGGC AGGAT C C AGGC CC T GC C AGGAAAAAT AT AAGGGC C C TGC GTG AGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 C AGAGGGGGTC ATCC AC TGC AT GAGAGT GGGGAT GT C AC AGAG TC C AGCC C AC C CT CC T G 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

I I I I I I I I I I I I I II I I I M I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 3421 C T T C C TGGAGC T C C AGGAACC AGG C AG T GAGGCC T T GGTC T GAG AC AG TAT C C T C AGGTC 3480 

Qy 3481 AC AGAGC AGAGGAT GC AC AGGGTG T GC C AGC AGTGAATGT T T GC C C TGAAT G C AC AC C AA 3540 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 AC AGAGC AGAGGAT G C AC AGGGT G T GC C AGC AGT GAATGT T T GC C C T GAAT GC AC AC C AA 3540 

Qy 3541 GGGC C C C AC C T GC C AC AGG AC AC AT AGG AC T C C AC AGAGT C T GG C C T C AC C T C C C T AC T G 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 3541 GGGC C C C AC C T GC C AC AGGAC AC ATAGGAC T C C AC AGAGT C TGGC C T C AC C T C C C T AC TG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 C C T TCAGGT T T TCAGGGGACAGGC CAAC CCAGAGGACAGGAT TC CC TGGAGGCC AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 C C T T C AGGT T T T C AGGGGAC AGGC CAAC C C AG AGGAC AGGAT T C C C T GGAGGC C AC AGAG 3720 

Qy 3721 GAGCAC C AAGGAGAAGAT C TGT AAGT AGGC C T TT GT T AGAGT C T CC AAGGT T C AGT T C TC 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 
Db 3721 GAG C AC C AAGGAGAAGAT C TGT AAGT AGGCC T T TGT T AGAGT C TC CAAGG T T C AGT T C TC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C C AC AC TC C T GC C T GC TGC C C TGAC GAGAGT C ATC AT GTC T C T T GAGC AGAGGAG 3900 

I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3841 C C T GC C C AC AC TC C T GC C T GC TGC C C TGAC GAGAGT C ATC ATGT C T C T TGAGC AGAGGAG 3900 

Qy 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 3901 TCT GC AC TGC AAGC C T GAGGAAGC C C T TGAGG C CC AAC AAGAGGC CC T GGGC C T GGTGTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I f I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I II t I I I I I I I I I I I I 
Db 4021 C AC TGC T GGGT C AAC AGAT C C TCC CC AGAG TC C TC AGGGAGC CTCCGCCTTTCC C AC TAC 4080 

Qy 4081 CAT C AAC T T C AC TC GAC AGAGGC AACC C AGT GAGGGT T C C AGC AGC C G TGAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT C AAC T T C AC TC GAC AGAGGC AAC C C AGT GAGGGT TC C AGC AGC C G TGAAGAGGAGGG 4140 

Qy 4141 GCC AAGC AC C T C T T G T ATC C T GGAGT C CTTGTTCC G AGC AGTAAT C AC TAAGAAGG TGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IE 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTC TGC TCC TCAAAT ATC GAGCC AGGGAGC CAGTCACAAAGGCAGA 42 60 

I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 4201 TGAT T TGGT TGGT T T TC TGC TCC TCAAAT ATC GAGC CAGGGAGC C AGT C AC AAAGGC AGA 42 60 

Qy 4261 AAT GC TGGAGAGTG T C ATC AAAAAT TAC AAGC AC TGTTTTCC TGAGAT C T T C GGC AAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AAT GC TGGAGAG TG T CATC AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC 4320 

Qy 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 44 40 

Qy 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

Qy 4501 C CAT GC T C C TG AGGAGGAAATC TGGGAGGAGC T GAG T GT GAT GGAGGT GT AT GAT GGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 501 C C ATGC TCC TGAGGAGGAAAT C TGGGAGGAGC T GAG TGT GAT GGAGGT GTATGAT GGGAG 4560 

Qy 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4620 

Qy 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I 
Db 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

Qy 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 47 40 

Qy 4741 GC AAGAGT TCGCTTTTTCTTCC C ATC C C TGCG T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCTTCC C AT CC C T GCG TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4 800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 48 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 
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Qy 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4921 GAAGAGAGCGGT C AG T G T TC T C AG T AGT AGGT T TC T GT T C TAT T GGGTGAC T T GGAGAT T 4980 

I I I I I I I I I I I 1 I I I I I I I If I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGCGG T C AG T G T TC T C AG T AGT AGGT T TC T GT T C TAT T GGGTGAC T T GGAGAT T 4 980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 T TC AGC ATCC AAGT T T ATGAAT GAC AGC AGTC AC AC AGT T C T GT GT AT AT AG T T T AAGGG 5100 

I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 T AAGAGT CTTGTGTTT TAT TC AGAT T GGGAAAT C CAT T C TAT T T TGTGAAT T GGGAT AAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I 

Db 5101 TAAGAGT C T TG T GT T T TAT TCAGATTGGGAAATC CAT TC TAT TTTGTGAATT GGGAT AAT 5160 

Qy 5161 AACAGCAGTGGAATAAGTACTTAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5161 AACAGCAGTGGAATAAGTACTTAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGATAG T C AAT TC T T GCC T TAT AC C T C AGT C TAT T C T G T AAA 5280 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAGATAG TC AAT TC T T GCC T TAT AC C T C AG T C TAT T C T G T AAA 5280 

Qy 5281 AT T T T T AAAGATATATGC ATAC C T GGAT T T C C T TGGC T T C T T T G AGAATGT AAGAGAAAT 5340 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T T AAAGATATATGC ATAC C T GGAT T T C C T T GGC T T C T T T GAGAAT GT AAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTT T GGAAGGC C C T GGGT TAGT AGT GGAGATGC T AAGG T AAGC C AGAC TC ATAC 5460 

Qy 54 61 CCACCCATAGGGTCG TAG AGTC TAGGAGCTGC AGTC ACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTC TAGGAGCTGC AGTC ACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C T AAAGATG T AGGGAAAAGT GAGAGAGGGG TGAGGG T G TGGGGC T C C GGGT GAG AGT G 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGC TGGGGC ATT TTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I M I I I I I II I I I I I I I I I 1 I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATT TTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 567 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 


RESULT 4 
136923 

LOCUS 136923 5674 bp DNA linear PAT 13-MAY-1997 
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Sequence 8 from patent US 5612201. 
136923 

136923.1 GI:2084883 

Unknown. 

Unknown. 

Unclassified. 

1 (bases 1 to 5674) 

De Plaen, E., Boon-Falleur , T . , Lethe, B., Szikora , J . -P . , De Smet,C. 
and Chomez, P . 

Isolated nucleic acid molecules useful in determining expression of 
a tumor rejection antigen precursor 
Patent: US 5612201-A 8 18-MAR-1997; 

Location/Qualifiers 

1. .5674 

/organism= "unknown" 
/mol_type="unassigned DNA" 


Query Match 100 
Best Local Similarity 100 
Matches 5674; Conservative 


,0%; Score 5674; 
.0%; Pred. No. 0; 
0; Mismatches 


DB 2; Length 5674; 


0; Indels 


0 ; Gaps 


0; 


Qy 

Db 

Qy 

Db 


1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 

I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 


61 


60 


60 


120 


ATC CAAAC ATC T TC ACGC T CACC C C C AGC C C AAGCC AGGC AGAAT C C GG T T C C AC C C C T G 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 


Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

M I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 C TC TC AAC C C AGGGAAGC C CAGGT GC C C AGAT GTGAC GC C AC T GAC T TGAGC AT T AG TGG 180 


181 T T AGAGAGAAGC GAGGT T T T C GGT C T GAGGGGC GGC T T GAGAT C GG T G GAGGGAAG C GGG 
I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 T T AGAGAGAAGC GAGGT T T TC GGT C T GAGGGGC GGC T T GAGATC GGT GGAGGGAAGC GGG 

241 C C C AGC T C T GT AAGGAGGC AAGGT GAC ATGC TGAGGGAGGAC T GAGGAC C C AC T T AC C C C 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
241 C C C AGC T C T G T AAGGAGGC AAGGT GAC ATGC T GAGGGAGGAC TGAGGAC C C AC T T AC C C C 

301 AGATAGAGGAC C CC AAATAATCC C T TC ATGC C AGT C C TGGAC CATC T GGTGGT GGAC T TC 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

301 AGATAGAGGAC C C C AAAT AAT C C C T T C ATGC C AGTC C T GGAC CATC T GGT GG TGGAC T T C 

361 T C AGGC T GGGC C AC C C C C AGC CCCCTTGCTGCT T AAAC C AC T GGGG AC T CGAAG T C AGAG 

I I I [ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 

421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 


240 


240 


300 


300 


360 


360 


420 


420 


480 


480 


Qy 

Db 

Qy 


481 CAT GC T C AGGAT TC T C AAGGAGGGC TGAGGGT C C C T AAGAC CC C AC T C C C G T GAC C C AAC 540 

I I I I I I I I I I II I I I I I I I I i I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
481 CAT GC TC AGGAT T C T C AAGGAGGG C TGAGGGT C CC T AAGAC CC C AC T C C C GT GAC C C AAC 540 

541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 
I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I II I I II I I I I 
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Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I 
Db 721 C C AGGAAAC AT C C GGGTGC C C GGAT GTGAC GC C AC T GAC T TGC GC AT T GTGGGGC AGAGA 780 

Qy 781 GAAGC GAGGT T TC C AT TC T GAGGGAC GGC GTAGAGT TCGGCC GAAGGAACC T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I II I I I I I I II I I I I I I I I 1 I I I I I II 
Db 781 GAAGC GAGGT T T C C AT TC T GAGGGAC GGC GTAGAGT TCGGCCGAAGGAACC T GAC C C AGG 840 

Qy 841 C T C T GT GAGGAGGC AAGGT GAGAGGC TG AGGGAGGAC TGAGGAC C C C G C C AC T C C AAATA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 C TC TGTGAGGAGGC AAGGT GAGAGGC TGAGGGAGGAC TGAGGAC CC C GC C AC TC C AAATA 900 

Qy 901 GAGAGC C C CAAAT AT T C C AGC C C C GC C C TTGC TGCC AGC C C T GGC C C AC C C GC GGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GAGAGC C C CAAAT AT T C C AGC C C C GC C C T TGC TGCC AGC C C T GGC C C AC C C GC GGGAAGA 960 

Qy 961 C G T C T C AGC C T GGGC T GCC C C C AGAC C C C TGC T C C AAAAG CC T T GAGAGAC AC C AGGT T C 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I . 
Db 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

Qy 1021 T T C T C C C C AAGC TC T GGAAT C AGAGGT T GC T G T GAC C AGGGC AGGAC T GG T T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 T T C T C C C C AAGC TC T GGAAT C AGAGGT T GC T G T GAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 T GAAC C T C AC AGATC TGAGAGAAGC C AGGT T CAT T T AAT GGT TC T GAGGGGC GGC T T GAG 1500 

I I I II I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TGAACCTC AC AGATC TGAGAGAAGCC AGGT TC AT TTAATGGTTCTGAGGGGC GGC TTGAG 1500 
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Qy 1501 AT C C AC T GAGGGGAG TGGT T T T AGGC T C TGTGAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

I I I E I I I I I I I I I I I I I I I I I I I I E I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 AT C C AC T GAGGGGAG TGGT T T T AGGC T C TGTGAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGCC C C AAAATGATC C AGTAC C AC CC C T GC TG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAATGATC C AGTAC C AC C C C T GC TG 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GG T C AGGAGAGGC AGGGC C C AGGC ATC AAGGT CCAGCATCCGCCC GGC AT TAGGGTCAGG 1800 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I l-l I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGC AT TAGGGTCAGG 1800 

Qy 1801 AC C C T GGGAGGGAAC T GAGGGT T C C CC ACC C AC AC C TGTC TC C T CAT C TC C AC C GC C ACC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

Qy 18 61 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

II i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 T C AAC C C AC GGAAGC C ACGGGAAT GGC GGC C AGGC AC T C GGAT C T T GAC G T C CC C AT C C A 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGGTC TGATGGAGGGAAGGGGC T T GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGG TC TGAT GGAGGGAAGGGGC T T GAAC AGGGC C T C AGGGGAGC AGAGGGAGGGC C C TAC 2040 

Qy 2041 T GC GAGAT GAG GGAG GC C T C AGAGGAC C C AGC AC C C TAGGAC AC C GC AC CCCTGTCT GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 T GC GAGAT GAGGGAG GC C T C AGAGGAC C C AGC AC C C TAGGAC AC C GC AC CCCTGTCT GAG 2100 

Qy 2101 AC T GAGGC TGC C AC T T C TGGC C TC AAGAAT C AGAAC GAT GGGGAC T C AGAT T GC AT GGGG 2160 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC T GAGGC T GC C AC T TC TG GC C T C AAGAAT C AGAAC GATGGGGAC T C AGAT T GC AT GGGG 2160 

Qy 2161 GTGGGACCCAGGCC T GCAAGGC T TACGC GGAGGAAGAGGAGGGAGGAC TC AGGGGACC TT 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GTGGGAC C C AGGC C T GCAAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

Qy 2221 GGAATC C AGAT C AGT GT GGAC C T C GGC C CT GAGAGG T C C AGGGC AC GG T GGC C AC AT AT G 2280 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAATCCAGATC AGT GTGGACCTC GGCC CTGAGAGGTCC AGGGC ACGGTGGCC AC ATATG 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 TCAGGTC AACAGAGGGAGGAGT TC CAGGATCC ATAT GGCCCAAGATGT GC CC CCT T CATG 2400 


http://es/ScoreAccessWeb/GetIt^ 


Qy 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I 
Db 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

Qy 2461 T TAGT AGC TC T AGGGGGAC C AGAT C AGGGAT GGC GG TAT G T T C C AT TC TC AC T T GT AC C A 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I 

Db 2461 T TAG T AGC TC T AGGGGGAC C AGAT CAGGGAT GGC GG TATGTTCC AT TCTC AC TTGTACC A 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T CAT G T C AGGGAAT TGGGGGT T GAGGAAGC AC AG GC GC T GGC AGGAAT AAAGAT GAGT 2 640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I II I I I 
Db 2581 AC T CAT G T C AGGGAAT TGGGGGT T GAGGAAGC AC AG GC GC T GGC AGGAAT AAAGAT GAGT 2 640 

Qy 2641 GAG AC AG AC AAGGC T AT TGGAATC C ACAC CCC AGAACC AAAGGGG T C AGC CC TGGAC ACC 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GAG AC AGACAAGGC TAT TGGAATC C AC AC C C C AGAACC AAAGGGG T C AGC C C TGGAC ACC 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 61 CAT TCTC AGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 GTC C C AGGAT C T GC C AT GCGTTCGGGT GAGGAAC AT GAGG GAGGAC TGAGGG T AC C C C AG 2880 

Qy 2881 GAC C AGAAC AC TGAGGGAGAC T GC AC AGAAAT C AGC CC T GCCCCTGC T GT C AC C C C AGAG 2 940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GAC C AGAAC AC TGAGGGAGAC TGCACAGAAAT C AGC CC T G C C C C T GC T GTC AC C C C AGAG 2 940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C T GC C AGGAGTCAAGGTGAGGAC C AAGC GGGC AC C T C AC C C AGGAC AC AT T AAT T C C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 C T GC C AGGAGT C AAGGTGAGGAC C AAdc GGGC AC C T C AC C C AGGAC AC AT T AAT TC C AAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 AC C AGC AAAAGGGC AGGAT C C AGGC C C T GC C AGGAAAAAT AT AAGGGC C C T G C GTGAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 ACC AGC AAAAGGGC AGGAT CCAGGCCC TGCC AGGAAAAAT AT AAGGGC CCTGCGTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 C T T C C TGGAGC T C C AGGAAC C AGGC AGT GAGGC C T T GGT C TGAGAC AG TAT C C T C AGGTC 3480 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

I I I I I I I I II I I I I I I II I I I J I I III I I I I II I I ill I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 GGGC C C C AC C T GC C AC AGGAC AC ATAGGAC TC C AC AGAGT C T GGC C T C AC C T C C C T AC T G 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T T C AGGT T T T C AGGGGAC AGGC C AAC C C AG AGGAC AGGAT T C C C TGGAGGC C AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 CC T T C AG GT T T T C AGGGGAC AGGC C AAC C C AG AGGAC AGGAT T C C C T GGAGGC C AC AGAG 3720 

Qy 3721 GAGC AC C AAGG AGAAGATC T GT AAGTAGGCC T T TGT TAGAGT C T C C AAGGT T C AGT T C T C 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 3721 GAGC AC C AAGG AGAAGAT C T GT AAGTAGGCC T T TGT TAGAGT C T CCAAGGT T C AGT T C T C 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 CC T GC C C AC AC T C C T GC C T GC T GC CC TG AC GAGAG T CAT CAT GT C T C T TGAG C AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 CC T GC C C AC AC T C C T GC C T GC T GC C C T G ACGAGAGT C AT C ATGT C T C T T GAGC AGAGGAG 3900 

Qy 3901 TC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC CC AAC AAGAGGC C C T GGGC CTGGTGTG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 TC T GCAC T GC AAGC C T GAGGAAGC C C T T GAGGC CC AAC AAGAGG C C C T GGGC CTGGTGTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 C AC T GC T GGGT C AAC AGAT C C T C C C C AG AGTC C TC AGGGAGC CTCCGCCTTTCC C AC T AC 4080 

Qy 4081 CAT C AAC T TC AC T C GAC AG AGGC AAC C C AGT GAGGG T TC C AGC AGC C G T GAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT C AAC T TC AC T C GAC AG AGGC AAC C C AGT GAGGGT TC C AGC AGCC G T GAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4 380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I 1 I I I I I I i I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4 441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4 500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 4 4 41 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4 500 

Qy 4 501 C CAT GC T C C T GAGGAGGAAATC TGGGAGGAGC T GAG TGT GAT GG AGGT GTAT GAT GGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 501 C C AT GC T C C T GAGGAGGAAATC TGGGAGGAGC T GAG TGT GAT GGAGGT GTAT GAT GGGAG 4560 

Qy 4 561 GGAGCAC AGTGCC TATGGGGAGCC CAGGAAGC TGC T CAC CCAAGATT T GGTGCAGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 561 GGAGCAC AGTGCC TATGGGGAGCC CAGGAAGC TGC T CAC CCAAGATT T GGTGCAGGAAAA 4 620 

Qy 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 47 40 

Qy 4741 GC AAGAG TTCGCTTTTTCTTCC CAT C C C T GC G T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCTTCC CAT C C C TGC G T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 48 60 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4 8 60 

Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

Qy 4 921 GAAGAGAGC GG TC AG T G T T C T C AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T TGGAGAT T 4 980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGC GG T C AG TGT T C T C AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 
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Qy 5161 AACAGCAGTGGAATAAGTACTTAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AGTGG AATAAGT ACT T AGAAAT GT GAAAAATGAGC AGT AAAATAGAT GAG ATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG TC AAT T C T TGC C T TAT AC C T C AGT C TAT T C TG T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAGAT AG TC AAT T C T TGCC T TAT AC C T CAGT C TAT T C TG T AAA 5280 

Qy 5281 AT T T T T AAAGAT ATATGC AT AC C T GGAT T T C C T T GGC T TC T T T GAGAATGT AAGAGAAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 5281 AT T T T T AAAGAT ATATGC AT AC C T GGAT T T C C T T GGC T TC T T T GAGAATGT AAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C T AAAGAT G T AGGGAAAAGT GAGAGAGGGG TGAGGGTG T GGGGC T C CGGGT GAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II M I II I I I I I I I I I 

Db 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 
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Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I 
Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 C TC TC AACC C AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC T G AC T T GAGC AT T AGTGG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I E I I I I I I I 1 I I I I 
Db 121 C T C TC AAC C C AGGGAAGC C C AGGT GCC C AGAT GTGAC GC C AC T GAC T T GAGC AT T AGTGG 180 

Qy 181 T T AGAGAGAAGCGAGGT T T T C GGT C TGAGGGG C GGC T T GAGATC GGTGGAGGGAAGCGGG 240 

I I I i I I I I I I I I I I I i I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 T T AGAGAGAAGC GAGGT T T TC GGT C TGAGGGGC GGC T T GAGAT C GGT GGAGGGAAGC GGG 240 

Qy 241 CC C AGC T C T GT AAGG AGGC AAGG T GAC AT GC T GAGGGAGGAC T GAGGAC C C AC T TAC C C C 300 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I 1 I I I I I I I M I I I I I I I I I I I I I I I 
Db 241 CC C AGC T C T GT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC C CAC T TAC C C C 300 

Qy 301 AGAT AGAGGAC CC C AAAT AATC C C T TC AT GC C AGT C C T GGAC C ATC TGGT GG T GGAC T T C 360 

I M I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

Qy 361 T C AGGC T GGGC CAC C C C C AGC CCCCTTGC TGC T TAAAC CAC T GGGGAC TC GAAG TC AGAG 420 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 T C AGGC T GGGC CAC C C C C AGC C C C C T T GC T GC T TAAAC CAC TGGGGAC TC GAAGT C AGAG 420 

Qy 421 CTCCGTGT GAT C AGGGAAGGGC T G C T T AGGAGAGGGC AGC GT C C AGGC T C T GC C AGAC AT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CAT GC T C AGGAT T C T C AAG GAGGGC TGAGGGT C CC T AAGAC C C CAC T C C C GT GAC C C AAC 540 

I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 C C AGGAAAC AT C C GGGT GC C C GGAT GT GAC GC CAC T GAC T T GC GC AT T GT GGGGC AGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 C CAGGAAACAT C C GGGTGC C C GGAT GT GAC GC CAC T GAC T TGC GCATTGT GGGGC AGAGA 780 

Qy 781 GAAGC GAGGT T T C CAT T C T GAGGGACGGCGTAGAGT TC GGC C GAAGGAAC C T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGGT T TC C AT TC T GAGGG AC GGCGT AGAG T T C GGC C GAAGGAAC CT GACC C AGG 840 

Qy 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I 


http://es/ScoreAccessWeb/GetItem.action?AppId=08819669&seqId=609516&ItemNa 8/30/06 


Db 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I II I I I I I f I I I I I I I I I I I I I I 

Db 901 GAGAGC C C C AAAT AT T C C AGC CCC GC C C T T GC T GC C AGC C C T GGCC C AC CCGC GGG AAGA 960 

Qy 961 CGT C TC AGC C T GGGC T GC C C C C AGAC C C C T GC T C C AAAAGC C T T GAGAGAC AC C AGGT TC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 961 CGT C TC AGC C T GGGC T GC C C C CAGAC C C C T GC T C C AAAAGCC T T GAGAGAC AC C AGGT TC 1020 

Qy 1021 T TC T C C C C AAG C TC T GGAAT C AGAGGT T GC TG T GAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1021 T T C TC C C C AAG C TC TGGAAT C AGAGGT T GC TG TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 GC AGGGC AC AGGC TC TGC C AGGC ATC AAGATC AGC AC CC AAGAGGGAGGGC T GTGGGC C C 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 12 60 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 12 60 

Qy 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 14 41 TGAACC T CACAGATC TGAGAGAAGCCAGGT TC ATTT AATGGT TC TGAGGGGC GGC T TGAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 TGAAC C T CACAGATC T GAGAGAAGC C AGGT TC AT T T AAT GGT T C TGAGGGGC GGC T T GAG 1500 

Qy 1501 ATC CAC T GAGGGGAGTGGT T T TAGGC TC TGTGAGGAGGCAAGGT GAGATGC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 AT C CAC T GAGGGGAGT GGT T T TAGGC TC T GTGAGGAGGC AAGG T GAGAT GC T GAGGGAGG 1560 

Qy 1561 AC T GAGG AGGC AC AC ACC C C AGGT AG AT GGCC C C AAAAT GATC C AGT AC CAC C C C T GC T G 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AC T GAGG AGGC AC AC ACC C CAGGT AGAT GGCC C CAAAATGAT C C AGT AC CAC C C C T GC T G 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 
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Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 

I I I I I I I I I I I I t I I I II I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I M I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG TC T GATGGAGGGAAGGGGC T T GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGC C C TAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GGG TC T GATGGAGGGAAGGGGC T T GAAC AGGGC C TC AGGGGAGC AGAG GGAGGGC C C TAC 2040 

Qy 2041 T GC GAGATGAGGGAG GC C T C AGAGGAC C C AGC AC C C TAGG AC AC C GC AC CCCTGTCT GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 2041 TGC GAGAT GAGGGAGGC C T C AGAGGAC C C AGC AC C C TAGGAC AC CGC AC C C C TGT C TGAG 2100 

Qy 2101 AC T GAGGC T GC C AC T TC TGGC C TC AAGAATC AGAAC GAT GGGGAC T CAGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 AC T GAGGC TGC C AC T TC TGGC C TC AAGAATC AGAAC GAT GGGGAC TCAGAT TGC ATGGGG 2160 

Qy 2161 GTG GGAC C C AGGC C T GC AAGGC T TAC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I 

Db 2161 GT GGGAC C C AGGC C T GC AAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

Qy 2221 GGAATC CAGAT C AGT GTGGAC C TC GGC C C TGAGAGG T C C AGGGC AC GGT GGC C ACATAT G 2280 

I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 GC C CAT AT T T C C TGC AT C T T T GAGGT GAC AGGAC AGAGC T GT GG T C TGAGAAG TGGGGC C 2340 

Qy 2341 T C AGGT C AAC AGAGGGAGGAGT TC C AGGAT CC AT AT GGC C C AAGATG T GC C C C C T T CAT G 2400 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 TC AGGT C AAC AGAGGGAGGAGT TC C AGGAT CC AT AT GGC C C AAGATGT GC C CC C T T CAT G 24 00 

Qy 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 AGGAC T GGGGATAT C C C C G GC T C AGAAAGAAGGGAC T C CAC AC AGT C T GGC TGTCCCCTT 2460 

Qy 2461 T TAG TAGCTCTAGGGGGAC CAGAT CAGGGATGGCGGTATGTTCC AT TCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 24 61 T TAG TAGCTCTAGGGGGAC CAGAT CAGGGATGGCGGTATGTTCC AT TCTCACTTGTACCA 2 520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

i I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T CAT G T C AGGGAAT T GGGGGT T GAGG AAGC AC AGGC GC T GGC AGGAAT AAAGAT GAGT 2640 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I 

Db 2581 AC T C ATG T C AGGGAAT TGGGGGT T GAGG AAGC AC AGGC GC TGGC AGGAAT AAAGAT GAGT 2640 

Qy 2 641 GAGAC AGAC AAGGC TAT TG GAAT C CAC AC C C C AGAAC CAAAGGGGT C AGC C C T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 641 GAGAC AGAC AAGGC TAT TGGAATC C AC ACC CC AGAAC C AAAGGG GT C AGC C C TGGAC ACC 2700 
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Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I 

Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 27 61 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 27 61 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GTC CC AGGAT C T GC C ATGC GT T C GGGT GAGGAAC AT GAGGGAGGAC T GAGGG T AC C C C AG 2880 

I I I I I I I I I I I I I I I I I I I I I I i I I I I I I i I I I I I I II I I I I I I I I I I II I I I I I I II I I 

Db 2821 GT C CC AGGAT C T GC C ATGC GT T CGGGT GAGGAAC AT GAGGGAGGAC T GAGGG T AC C C C AG 2880 

Qy 2881 GAC C AGAAC AC TGAGGGAGAC T GC AC AGAAAT C AGC CCTGCCCCTGC T GT CAC C C C AGAG 2940 

I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2881 GAC C AGAAC AC TGAGGGAGAC T GC AC AGAAAT C AGC CCTGCCCCTGC T GTC AC C C C AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I II II I I I I I I I I I I II I I I I I I 

Db 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 AC G GGGAGGC C T T GGT C TGAGAAG GC T GC GC T CAGG TC AG T AGAGGGAGC GT C C C AGGC C 3060 

Qy 30 61 C TGCCAGGAGT CAAGGTGAGGACC AAGCGGGC ACC T C ACC CAGGACAC AT TAAT TCCAAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 3061 C TGCCAGGAGT C AAGGTGAGGAC C AAGC GGGC ACC TC AC C CAGGACAC AT TAAT TC C AAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I II I I I I I I I I I I I I I I I 

Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 AC C AGC AAAAGGGC AGGAT C C AGGC CC T GC C AGGAAAAAT AT AAGGGC C C T GC GT GAGAA 3300 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I M I 

Db 3241 AC C AGC AAAAGGGC AGGAT C CAGG C C C T GC C AGGAAAAAT AT AAGGGC C C TG C GTG AG AA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3301 C AGAGGGGGT C ATC C AC T GC AT GAGAGT GGGGAT GT C AC AGAGT C C AGC C CAC C C T C C TG 3360 

Qy 3361 G T AGC AC T GAG AAGC CAGG GCTGTGCTT GC GG TC T GC AC C C T GAGGGC C C GT GGAT T C C T 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3361 GT AGC AC TGAG AAGC CAGGGCTGTGCTTGCGGTCTGC ACC CTGAGGGCCCGT GGAT TCCT 3420 

Qy 3421 C T T C C T GGAGC T CCAGGAAC C AGGC AGT GAGG C C T T GGT C T GAG AC AG TATC C T C AGGTC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3421 C T T C C T GGAGC T C C AGGAAC C AGGC AGT GAGGC C T T GGT C T GAG AC AG T ATC C T C AGGTC 3480 

Qy 34 81 AC AGAGC AGAGGATGC AC AGGGTG T GC C AGC AGT GAAT GT T T GC C C T GAATG C AC AC C AA 3540 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGC C C CAC C T GC C AC AGG AC AC ATAGGAC T C CAC AGAGT C T GGC C T C AC C T C C C T AC T G 3600 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 
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I I I I I I I ! I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I E I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 C C T TCAGGT T T T C AGGGGAC AGGC C AAC C C AGAGGAC AGGATT C C C T GGAGGCC AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 3661 CC T TC AGGT T T TC AGGGGAC AGGC CAACC C AGAGGAC AGGAT TC C C T GGAGGC C AC AGAG 3720 

Qy 3721 GAGC AC C AAGGAGAAGATC T G T AAGT AGGC C T T TGT TAGAGTC T C C AAGGT T C AGT T C TC 3780 

I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGC AC C AAGGAGAAGATC TGTAAGTAGGC C T T TGT TAGAGTC T C C AAGGT T C AGT T C T C 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 CC T GC C C AC AC TCCTGCCTGCT GC CC TGAC GAG AGT C AT C ATGT C T C T TGAGC AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 CC T GC C C AC AC T C C T GC C T GC TGC CC TGAC GAGAGT CATC ATGT C TC T TGAG C AGAGGAG 3900 

Qy 3901 TC T GC AC TGC AAGC C T GAGGAAGC CC T T GAGGC C CAAC AAGAGGC C C T GGGC C TGGT GTG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 TC T GC AC T GC AAGC C TGAGGAAGC CC T T GAGGC C CAAC AAGAGGC C C T GGGC C T GGT GTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 39 61 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I 

Db 4 021 C AC T GC T GGGT C AAC AGAT CC TC C CCAGAGTCC T C AGGGAGC C T C CGC C T T T C C C AC T AC 4080 

Qy 4081 CAT CAAC TTC AC T C GAC AG AGGC AAC C C AG T GAGGG T TC C AGC AGCC G T GAAGAGGAGGG 4140 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 4081 CAT CAAC T T C AC TC GAC AG AGGC AAC C C AGT GAGGG T T CC AGC AGCC G TGAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCC AAGC ACCTCTTGTATCCTGGAGTCCT TGT TCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGT TGGTT T TCTGC TCC T CAAATATCGAGC C AGGGAGC CAGT CACAAAGGCAGA 42 60 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AAT GC TGGAGAG TG T C AT C AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T TC GGC AAAGC 4 320 

I I II I I I I I M I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 61 AAT GC T G GAGAGT GT CAT C AAAAAT TAC AAGC AC TGTTTTCC TG AGAT C T T C GGC AAAGC 4320 

Qy 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I [ I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 II 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4 441 GAT C AT GC C C AAGAC AGGC T T C C T GAT AAT T G TC C TGGT C AT GAT T GC AATG GAGG GC GG 4500 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I 
Db 44 41 GATCATGCCC AAGAC AGGC TTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

Qy 4 501 CCATGC T CC TGAGGAGGAAATC TGGGAGGAGC TGAGTGTGATGGAGGT GTAT GATGGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 


http://es/ScoreAccessWeb/GetItem.action?AppId=08819669&seqId=609516&ItemNam 8/30/06 


Db 4501 CCATGC T C C T GAGGAGGAAATC TGGGAGGAGC T GAG T GTGAT GG AGG T GT AT GAT GGGAG 4560 

Qy 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4620 

I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 4561 GGAGC AC AGTGCC TATGGGGAGCC CAGGAAGC TGC TCACC CAAGATT TGGTGCAGGAAAA 4620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

Qy 4 681 CC AAGGGC C C T C GC T GAAAC C AGC TAT G T GAAAGT C C T T GAGTATGT G AT C AAGGT C AGT 4 740 

I I I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 4741 GC AAGAG TTCGCTTTTTCTTCC CAT C C C TGC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I M I I I I I I M 
Db 4741 GC AAGAG TTCGCTTTTTCTTCC C ATC C C T GC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 48 60 

Qy 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

Qy 4921 GAAGAGAGC GG TC AGT GT T C TC AG T AGT AGGT T TC T GT T C TAT T GGGTGAC T T GGAGAT T 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 921 GAAGAGAGC GG T CAG T GT T C T C AG TAGT AGGT T T C T GT TC TAT T GGGT GAC T TGGAGATT 4 980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 T AAGAG TCTTGTGTTT TAT T C AGAT TGGGAAAT C CAT T C TAT T T T GT GAAT T GGGATAAT 5160 

I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGT C TTGTGTTT TAT T C AGAT TGGGAAAT C CAT T C T AT T T T GT GAAT T GGGATAAT 5160 

Qy 5161 AAC AGC AGT GGAAT AAGT AC T T AGAAAT GT GAAAAATGAGC AGT AAAAT AGAT GAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AGT GGAAT AAGT AC T T AGAAAT GT GAAAAAT GAGC AG T AAAAT AGAT GAG AT AA 5220 

Qy 5221 AG AAC T AAAGAAAT T AAGAGATAG T C AAT T C T T GC C T TAT AC C T C AGT C TAT T C T G T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAGATAG TC AAT T C T TGC C T T AT ACC T C AGT C TAT TC T G T AAA 5280 

Qy 5281 AT T T T TAAAGATATATGCATACC T GGAT TTCC T TGGC T TC T T TGAGAATGTAAGAGAAAT 5340 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T T AAAGAT AT AT GC AT AC C T GGAT T T C C T T GGC T T C T T TGAGAATGTAAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 
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Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I II I I I I I II I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C TC T AAAGAT G TAGGGAAAAGT GAGAGAGGGG TGAGGG T G TGGGGC TC C GGG TGAG AGT G 5580 

I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M 
Db 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCC GGG TGAG AGT G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGC TGGGGC AT TTTGGGCTTTGGGAAACTGC AGT TCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCAT TTTGGGCTTTGGGAAACTGC AGT TCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 
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AR322041 5674 bp DNA 

Sequence 8 from patent US 6565857. 
AR322041 

AR322041.1 GI:33707547 


Unknown. 

Unknown. 

Unclassified. 

1 (bases 1 to 5674) 

van den Eynde,B., van den Bruggen, P. and Boon-Falleur , T . 

Methods for treating a disorder by using Mage-3 or Mage-3 related 

materials 

Patent: US 6565857-A 8 20-MAY-2003; 

Ludwig Institute for Cancer. Research; New York, NY 
Location/Qualif iers 
1. .5674 

/or ganism= "unknown" 
/mol_type=" genomic DNA" 


Query Match 100.0%; Score 5674; DB 2; Length 5674; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5674; Conservative 0; Mismatches 0; Indels 0; 


Gaps 


0; 


Qy 

Db 


CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 


Qy 

Db 

Qy 

Db 


61 AT C C AAAC ATC T T C AC GCT C AC CC C C AG CCCAAGC C AGGC AGAAT C C GGT TC C AC C C C T G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 AT C C AAAC AT C T T C AC GC T C AC C C C C AGCC CAAGC C AGGC AGAAT C C GGT TC C AC C C C TG 120 

121 C T C TC AAC C CAGGGAAGCC C AGGT GC C C AGATG TGAC GC C AC TGAC T T GAGC ATT AGT GG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

121 C TC T C AAC C CAGGGAAGCC C AGGT GC C C AGAT GT GAC GC C AC TGAC T T GAGC AT TAG T GG 180 


Qy 

Db 

Qy 


181 T TAGAGAGAAGC GAGGT TT T C GGT C T GAGGGGC GGC T T GAGATC GGTGGAGGGAAGC GGG 240 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 T T AGAGAGAAG C GAGGT T T TC GGT C TGAGGGGC GGC T TGAGATC GGTGGAGG GAAGC GGG 240 

241 C C C AGC T C T GT AAGGAGGC AAGGT GAC AT GC TGAGGGAGGAC TGAGGAC C C AC TT ACC C C 300 


http://es/ScoreAccessWeb/Gette^ 8/30/06 


I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I M 

Db 241 C C C AGC T C TGT AAGG AGGC AAGGTGAC ATGC T GAGGGAGGAC T G AGGAC C C AC T T AC C CC 300 

Qy 301 AGATAGAGGAC CC C AAATAAT C C C T TC ATGC C AGTC C TGGAC CAT C T GGTGG TGGAC T TC 360 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 301 AGATAGAGGAC C C C AAATAAT C C C T TC AT GC C AGT C C TGGAC CATC TG G TGG TGGAC T TC 360 

Qy 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I I I I t I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I i 
Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CAT GC TC AGGAT T C T C AAGGAGGGC TGAGGGT C C C T AAGAC C C C AC TC C C G T GAC C C AAC 540 

I I I I I I I I I I II I II I I I I I I I I I I I II II II II I I I I I I I I II I I I I I II I I I I I I I I I 
Db 481 CAT GC T C AGGAT T C T CAAG GAGGG C TGAGGGT C C C T AAGAC C C C AC TC C C G T GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I II I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

Qy 781 GAAGC GAGGT T T C CAT TC T GAGGGAC GGC GT AGAG T TCGGC C GAAGGAAC C T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGGT T T C CAT T C T GAGGGAC GGC GTAGAGT T C GGC C GAAGGAAC C T GAC C C AGG 840 

Qy 841 C T C TGT GAGGAGGC AAGGT GAGAGGC T GAGGGAGGAC TGAGGAC C C C GC C AC T CC AAAT A 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 841 C TC T G TGAGGAGGC AAGGT GAGAGGC TGAGGGAGGAC TGAGGAC C C C GC C AC TC C AAATA 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

Qy 1021 TTC TCCC CAAGC TC TGGAATCAGAGGTTGCTGTGAC CAGGGC AGGAC T GGT T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TT C T C C C CAAGC T C T GGAAT C AGAGGT T GC T GTGAC C AGG GC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I i I I I I I 

Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 12 60 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 T GAAC C T C ACAGATC T GAG AGAAGC C AGGT TC AT T T AATG GT T C TGAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I I I I I I II I I I I I I I 1 I I I I II I I I I I I I I I I I I I I I II I I I II I I I I I I 

Db 1441 T GAAC C T C ACAGATC T GAG AGAAGC C AGGT TC AT T T AATG GT T C TGAGGGGC GGC T T GAG 1500 

Qy 1501 ATCCACTGAGGGGAGTGGT TTTAGGCTC TGTGAGGAGGCAAGGTGAGATGCTGAGGGAGG 1560 

I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 1501 ATC CAC T GAGGGGAGTGGT T TTAGGCTC TGTGAGGAGGC AAGGT GAGATGC TGAGGGAGG 1560 

Qy 1561 AC T GAGG AGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GATC C AGT AC CAC C C C TGC T G 1620 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GATC C AGT AC CAC C C C TGC T G 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGT C AGGAGAGGC AGGGC CC AGGC ATC AAGGT CCAGC AT CCGCCC GGC AT TAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGC AT TAGGGTCAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I II I M I I I I I I I I I I I I I I I 

Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 61 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGGTCTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAGAGGGAGGGCCCTAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GGG T C T GATGG AGGGAAGGGGC T T GAAC AGGGC C T C AGGGGAGC AGAGGGAGGGC C C T AC 2040 

Qy 2041 TGC GAGATGAGGGAGGC C T C AGAGGAC C C AGC AC C C T AGGAC AC C GC AC C CC T GTC TGAG 2100 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2041 TGC GAGATGAGGGAGGC C T C AGAGGAC C C AGC AC CC TAGGAC AC CGC AC CCCTGTCT GAG 2100 
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Qy 2101 AC T GAGGC T GC CAC T TC T GGC C TCAAGAATC AGAAC GATGGGGACTC AGAT T GC ATGGGG 2160 

I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I t I I I I I I I I I I I I I 1 I I I I I I I I I I I I f 
Db 2101 AC T GAGGC T GC CAC T TC TGGC C TC AAGAAT C AGAAC GATGGGGAC T C AGAT T GC ATGGGG 2160 

Qy 2161 GTGGGAC CC AGGCC TGCAAGGC TT ACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGACC T T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GTGGGAC CCAGGCCTGCAAGGC TTACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGACC T T 2220 

Qy 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

i I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAATC C AGAT C AGTGT GGAC C TC GGC C C TGAGAGG TC C AGGGC AC GGTGGC C AC AT ATG 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 TC AGGT C AAC AGAGGGAGGAGT TC C AGGATC C AT AT GGCC C AAGATGT GC C C C C T T CAT G 2400 

Qy 2401 AGGAC TGGGGAT ATC C C C GGC T CAGAAAGAAGGGAC T C C AC AC AGT C T GGC TGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGGAC TGGGGAT ATC C C C GGC T CAGAAAGAAGGGAC T C CAC AC AGT C T GGC TGTCCCCTT 2460 

Qy 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 T T AGTAGC TC T AGGGGGAC CAGAT C AGGGAT GGCGG TATG T T C C AT T C T C AC T T GT AC C A 2520 

Qy -2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T C ATG T C AGGGAAT T GGGGGT T GAGG AAGC AC AGGC GC T GGC AGGAATAAAGATGAGT 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AC T C ATG T C AGGGAAT T GGGGGT T GAGGAAGC AC AGGC GC T GGC AGGAAT AAAGAT GAGT 2640 

Qy 2641 GAGAC AG AC AAGGC TAT T GGAATC CAC AC C C C AGAACC AAAGGGGT C AGC C C T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2641 GAGAC AG AC AAGGC TAT T GGAAT C CAC AC C C C AGAACC AAAGGGGTC AGC C C TGGAC ACC 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

Qy 27 61 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I i I 

Db 27 61 C AT TC T C AGAGGGTGAC T C AGGT C AAC G T AGGGAC C CC C AT C T G G T C T AAAGAC AGAGCG 2820 

Qy 2821 GT C CC AG GAT C TGC CAT GC G T TC GGGTG AGGAAC AT GAGGGAGGAC T GAGGG T AC C C C AG 2880 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 GT C CC AGGAT C T GC CAT GC GT TCGGGTGAGGAAC AT GAGGGAGGAC TGAGGG TAC C C C AG 2880 

Qy 2881 GAC C AGAAC AC TGAGGGAGAC T GC AC AGAAAT C AGC CC T G C C C C T GC TGT C AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GAC C AGAAC AC TGAGGGAGAC TGC AC AGAAAT C AGC CC TGC C CC T GC T GT CAC CCC AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 1 I 
Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 
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Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 3001 AC GGGGAGGC C T T GG TC TGAGAAGGC TGCGC T C AGG TC AG TAGAGGGAGCGT C C C AGGC C 3060 

Qy 3061 CTGCCAGGAGTCAAGGTGAGGACC AAGC GGGC ACC T C ACC CAGGACAC ATTAAT TC CAAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 C T GC C AGGAGT C AAGG TGAGGAC C AAGC GGGC AC C T CAC C CAGGACAC ATTAAT TC CAAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 32 41 AC C AGC AAAAGGGC AGGAT C C AGGC C C T GCC AGGAAAAAT AT AAGGGC C C T G C GTG AGAA 3300 

I I I I I I I I I II I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 AC C AGC AAAAGGGC AGGAT C C AGGC C C T GC C AGGAAAAAT AT AAGGGC C C TG C G T G AGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I II I I II I I I I I I I M I I II I I I M I I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I 

Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 33 61 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I M I I I I I I I I I I I I I I I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 C T T C C TGGAGC T C C AGGAAC C AGGC AGT GAGGC C TT GGT C TGAGACAG TAT C C TC AGGTC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 C T T C C T G GAGC T C C AGGAAC C AGGC AG T GAGGC C T T GGT C TGAGACAG TAT C C TC AGGT C 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGC C C C AC C T GC C AC AGGAC AC ATAGGAC T C C AC AGAGT C T GGC C TC AC C T C C C T AC T G 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 GGGC C C C AC C T GC CAC AGGAC AC AT AGG AC T C CAC AGAGT C TGGC C T C ACC T C C C T AC T G 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 C C T T C AG GT T T T C AGGGGAC AGGC C AAC CC AG AGGAC AGGAT T C C C TG GAGGC CAC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3661 C C T T C AGG T T T TC AG GGGAC AGGC CAAC CC AG AGGAC AGGAT T C C C T GGAGGC CAC AGAG 3720 

Qy 3721 GAG CAC C AAGG AGAAGATC TGT AAGTAGGC C T T T GT T AGAGT C T C C AAGGT T C AGT TC T C 3780 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGC AC C AAGGAGAAGAT C T GT AAGTAGGC C T T TGT T AGAGT C T C C AAGGT T C AGT T C T C 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C CAC AC TCCTGCCTGCTGCCCT GAC GAGAGT C ATC AT G T C T C T TGAGC AGAGGAG 3900 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 CCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAG 3900 

Qy 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I II I I I I E I I I I I ! I I I I E I I I I I I I I I I I I I I I I t I I I I I I I I I II I I I I I I I I I t I 1 I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II II I I I M I I I I I I 
Db 4021 C AC TGC T GGGT C AAC AGAT C C TCC CC AGAGTC C TC AGGGAGCC T CC GC C T T T C C C AC T AC 4080 

Qy 4081 CAT C AAC T TC AC TCG AC AGAGGC AAC C C AGTGAGGG T TC C AGC AGC CG T GAAGAGG AGGG 4140 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT C AAC T T C AC TCGAC AGAGGC AAC C C AGTGAGGG T TC C AGC AGC C G T GAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GC C AAGC AC C T C T T GT ATC C T GGAGT C C T T GT T CC G AGC AG T AATC AC TAAGAAGGT GGC 4200 

Qy 4201 TGAT TTGGT TGGTT T TC TGC TCC T C AAAT ATC GAGC C AGGGAGC C AGT C AC AAAGGC AGA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 42 60 

Qy 4261 AAT GC T G GAGAGT GTCAT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC 4320 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AATGCTGGAGAGTGT C ATC AAAAATT AC AAGC AC TGTTTTCCTGAGATCTTCGGC AAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GAT CAT G C C C AAGAC AGGC T T C C T GAT AAT T G TC C T GGT C AT GAT TGC AAT GGAGGGC GG 4500 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I 
Db 4441 GAT C AT GC C C AAGAC AGGC T T C C T GAT AAT T G T CC T GGT CAT GAT T GC AAT GGAGGGC GG 4500 

Qy 4501 CCATGC T CC TGAGGAGGAAATC TGGGAGGAGC TGAGTGTGATGGAGGTGTAT GATGGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4501 CCATGC T C C T GAGGAGGAAATC TGGGAGGAGC TGAG TGT G ATGG AGGTGT AT GAT GGGAG 4560 

Qy 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4 620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

Qy 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 47 41 GC AAGAG TTCGCTTTTTCTTCC C AT CC C T GC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAGT TC G CTTTTTCTTCC C ATCC C TGC G T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 4 801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 4 8 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

Qy 4921 GAAGAGAGC GG T C AG T GT T C T C AG T AGT AGGT TTCTGTTC T AT TGGGT GAC T TGGAGAT T 4980 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 921 GAAGAGAGC GGT C AG T GT T C T C AG T AGT AGGT TTCTGTTC TAT TGGGT GAC T TGGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I II I I I I I I I I I I I I I II I I I I M I I I I I I II I i I I I I I I I I I I M I I M I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 T T C AGC AT C C AAGT T TATGAAT GAC AGC AGT C AC AC AGT T C TG T GT AT AT AG T T TAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

Qy 5161 AAC AGCAGTGGAATAAGTAC T TAGAAATGTGAAAAATGAGC AGT AAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGCAGTGGAATAAGTAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AAT T C T T GC C T TAT AC C T C AGT C TAT TC TG T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 5221 AGAAC TAAAGAAAT TAAGAGATAGTCAATTC T TGCC TTAT AC C TCAGTCTAT TCTGTAAA 5280 

Qy 5281 AT T T T T AAAG AT AT AT GC AT AC C T GGAT T T C C T TGGC T T C T T T GAGAAT G T AAGAGAAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T TAAAGAT ATAT GC ATACC T GGAT T T C C T TGGC T TC TT T G AGAAT GT AAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 54 00 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C TAAAGATG TAGGGAAAAGT GAGAGAGGGGTGAG GGT G TGGGGC T C C GGG T GAG AGT G 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 5521 C T C T AAAGATGT AGGGAAAAGTGAGAGAGGGGT GAGGGTG TGGG GC T C C GGG TGAGAGT G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGC TGGGGC ATT TTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCT GAT TGTAATGATCT TGGGT GGAT CC 5 674 

I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 


RESULT 7 
AR361125 
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AR361125 5674 bp DNA linear 

Sequence 8 from patent US 6599699. 

AR361125 

AR361125.1 GI: 337 68828 


Unknown. 

Unknown. 

Unclassified. 

1 (bases 1 to 5674) 

Guagler,B., Van den Eynde,B., van den Bruggen,P. and 
Boon-Falleur, T . 

Methods for diagnosing a disorder by assaying for MAGE -3 

Patent: US 6599699-A 8 29-JUL-2003; 

Ludwig Institute for Cancer Research; New York, NY 

Location/Qualifiers 

1. .5674 

/organism=" unknown" 
/mol_type="genomic DNA" 


PAT 17-AUG-2003 


Query Match 100.0%; 
Best Local Similarity 100.0%; 
Matches 567 4; Conservative 


Score 5674; 
Pred. No. 0; 
0; Mismatches 


DB 2; Length 5674; 


0; Indels 


0 ; Gaps 


0; 


Qy 

Db 


CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 


Qy 

Db 

Qy 

Db 

Qy 

Db 


61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I 
121 C T C T C AAC C C AGGGAAGCC C AGGT GC C C AGAT G TGAC GC C AC T GAC T T GAGC AT T AGT GG 180 

181 T T AGAGAGAAGC GAGGT T T TC GGT C T GAGGGGC GGC T T GAGAT C GG T G GAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
181 T T AGAGAGAAGC GAGGT T T T C GGT C T GAGGGGC GGC T T GAGATC GGT G GAGGGAAGC GGG 240 


Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 


241 


241 


301 


301 


361 


361 


421 


421 


481 


481 


C C C AGC T C TGT AAGGAGGC AAGGT GAC ATGC T GAGGGAGGAC T G AGGACC C AC T T AC C C C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C C C AGC T C T GT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC C C AC T T AC C C C 


300 


300 


360 


AGAT AGAGGAC C CC AAAT AAT C C C T T CAT GCC AG T C C T GGAC CAT C T G GT GG T GGAC T T C 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGATAGAGGAC C CC AAATAATC C C T T C ATGCC AGT C C T GGAC CAT C T GG T GG T GGAC T T C 360 


TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I 
TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

CATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAAC 540 

I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
CATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAAC 540 


541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 
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i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i t i i i i t i i i i i i i i i i i i i I I 
I M 1 1 II 1 1 1 1 1 1 II 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 II 1 11 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I I I 


Db 

541 

CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 

600 

Qy 

601 

CCCCACATCCCCCACCCCAIOUL, lLAALLt ItjAlvjUUUAl OL.tjOOUAVjL.t~.Al itLA^L^ l 



i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i t i l l l l l l l 1 1 1 1 1 1 1 1 1 1 1 
I || | | | 1 | 1 | 1 i 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 H 1 1 1 1 1 1 1 1 


Db 

601 

CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 

660 

Qy 

661 

CACCCCCACCCCCACCCCCACGCCUAO ICLLAttLLLALLLAuljLAbbAlUCbbl ItLLb 

190 


i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i I i i i I I I t I I > I t I I 1 1 1 1 1 1 1 1 1 1 1 1 1 
I I M I I I I I I 1 1 1 1 1 1 1 1 1 II II II 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 


Db 

661 

CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 

720 

Qy 

721 

CCAGGAAACATCCGGGTGCCCGGAIGIGACGCCACIGACI lbtbLAl 1<j I (jVj WjUAWVjA 

/ O u 


■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 
I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

721 

CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 

780 

Qy 

781 

GAAGCGAGGT T TC CAT T C T GAGGGACGGC G T AGAGT TC GGC CGAAGGAAC U I LjAU L, O ALtLt 

O H U 


■ ■ i i • i i ■ ■ i i ■ t i i ■ i i ■ i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 
I I M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

781 

GAAGC GAGG T T TC C AT T C T GAGGGAC GGC GTAGAGT T C GGC CGAAGGAAC C T GAC C C AGG 

840 

Qy 

841 

C T C T G T G AGGAGGC AAGG T G AG AG GC T G AGGG AG GAC T GAGG AC C C C G C CAC I C C AAA 1 A 

q n n 
y U U 


i i i i ■ ■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i > i i i i i t i i t i i i i i i i t i i i i i i i i 

M 1 1 1 1 1 1 1 1 1 1 1 1 IE 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

841 

CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 

900 

Qy 

901 

GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCC IGGOOOACCCGCGGGAAGA 

r DU 


i i i ■ i i ■ i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i 
I | II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 


Db 

901 

GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 

960 

Qy 

961 

CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCI I GAG AG AC AC C AG Gl 1C 

i non 
1UZU 


■ i i i i i i i i i i i i i i ■ i r ■ i i I I I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 M 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

961 

CGT C T C AGC C T GGGC T GC C C C C AGAC C C C T GC T CC AAAAGC C T T GAGAGAC AC C AGGT TC 

1020 

Qy 

1021 

T T C TC C C C AAGC T C T GGAAT C AGAGGT T GC TG TGAC C AGGGC AGGAC T GG T T AGGAGAGG 

lUoU 



i i i i i i i i i i i ■ i i i i i i i i i i i i i i i i i i i i i i t i i i i i t i i t i i i i i i i t i i i i i i i i 

1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

1021 

T T C TC C C C AAGC T C TGGAAT C AGAGGT T GC TG T GAC C AGGGC AGGAC T GGT T AGGAGAGG 

1080 

Qy 

1081 

GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 

i i /in 



i i i i i ■ i i i i i i ■ i i i i i i i i i i i i > t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

1 1 1 1 I 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

1081 

GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 

1140 

Qy 

1141 

C C AAGAC T GC AC T CC AAT C C C CAC TC CC AC CC C AT T CGC AT T CC C AT TC C CC AC C C AAC C 




i i i i i i i i i i i i i r i ■ i i i i I I I t i I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 I 1 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 


Db 

1141 

CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 

1200 

Qy 

1201 

CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCC1AC ICCGICACC IbALLALL 

-LZ DU 


i i i i i i i i i i i i i i i i i i i i i i i i i i i i i > i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i 
I | I 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

1201 

CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 

1260 

Qy 

1261 

ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 

i "3 o n 


i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i t i i i i i i i < i i i i t i i i i i i i i i i i i i 
1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

1261 

ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 

1320 

Qy 

1321 

CCCACCCTCATCTCTCTCATGTGCCCCACTCCCAICGCC I CCCCCA1 iC 1 CjCjUALtAAIUU 

1 jDU 


i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i I I I I I 1 I t 

1 1 1 1 II 1 1 1 1 1 II 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

1321 

CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 

1380 

Qy 

1381 

/-% r^t m m m /~+ r** r** r** m m/*' m/**T\ tv /~* r+ T\ /~* Tv Tv f* r* /~* rrt /~* t~* rn Tv TV m m t~* "A 7\ 7\ f f~* 7\ r~* Ti /^** 7\ f~* T 1 

GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCC IGGTAGGCCCGAIGIGAAACCAt- IvjAUI 

i a a n 


i i i i i i i i i i i i i i i i i i i i i i i i t i I I I I I I I I I t i I I I I I I 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1! 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 


Db 

1381 

GGT TTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAAC CAC TGAC T 

1440 

Qy 

1441 

T GAAC C TC AC AGATC T GAG AGAAGC C AGGT TC AT T T AAT GGT T C T GAGGGGC GGC T TGAG 

1500 


1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 
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Db 14 41 TGAAC C T C AC AGATC TGAG AGAAGCC AGGT TC AT T T AAT GGT TC TGAGGGGC GGC T T GAG 1500 

Qy 1501 ATC C AC T GAGGGGAG T GGT T T T AGGC T C TGTG AGGAGGC AAGGT GAGATGC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I i I I I I I I 

Db 1501 ATC C AC T GAGGGGAG T GGT T T T AGGC T C TGTGAGGAGGC AAGGT GAGATGC T GAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGG T AGAT GGC C C C AAAATGAT C C AGTAC C AC C C C T GC TG 1620 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGCC C C AAAATGAT C C AGTAC C AC C C C T GC TG 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GGT C AGGAGAGGC AGGGCC C AGGC AT C AAGGT CCAGC ATC CGCCCGGC AT TAGGGTC AGG 1800 

Qy 1801 AC C C T GGGAGG GAAC T GAGGGT T C CC C AC C CAC ACC TGTCTCCT CAT C T C C AC C GC C AC C 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG TC TGATGGAGGGAAGGGGC T T GAAC AGGGC C TC AGGG GAGC AGAGGGAGGGC C C T AC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1981 GGGTC TGATGGAGGGAAGGGGC T T GAAC AGGGCC TCAGGGGAGC AGAGGGAGGGCC C TAC 2040 

Qy 2041 TGCGAGATGAGGGAGGCCTCAGAGGACCCAGCACCC TAGGACACCGCACCCC TGTC TGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 TGCGAGATGAGGGAGGCCTCAGAGGACCCAGCACCC TAGGACACCGCACCCC TGTC TGAG 2100 

Qy 2101 AC T GAGGC TGC CAC T TC TGGC C T C AAGAATC AGAAC GAT GGGGAC TC AGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 2101 AC T GAGGC TGC CAC T T C T GGC C T C AAGAAT C AGAAC GATGGGGAC TC AGAT T GC AT GGGG 2160 

Qy 2161 GT G GGAC C C AGGC C T GC AAGGC T TAC GC GGAGGAAGAGGAGGGAGGAC TC AG GGGAC C T T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 GTGGGAC C C AGGC C T GC AAGGC T TAC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

Qy 2221 GGAAT CC AGAT C AGT GT GGAC C T C GGC C C T GAGAGG TC C AGGGC AC GG TGGC CAC AT AT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

Qy 2281 GC C CAT AT T T C C T GC AT C T T T GAGG T GAC AGGAC AGAGC T G TGG TC T GAGAAGTGG GGC C 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TCAGGTC AACAGAGGGAGGAGT TC C AGGATCC ATAT GGCC CAAGATGT GCCC CC TT CATG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I 

Db 2341 T CAGGTC AACAGAGGGAGGAGT T C C AGGAT C CAT AT GGCC C AAGAT GT GC C C C C T T CAT G 2400 


http://es/ScoreAccessWeb/GetItem.action?AppId=08819669&seqId=609516&ItemName=us. 


Qy 

2401 

AGGACTGGGGATATCCCCGGO 1 CAGAAAGAAGGGAL. 1 L-UA^iVi^ALr itl vjijr^ J.ijlL,Uv_,L,li 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

2401 

AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 

2460 

Qy 

24 61 

TTAGTAGCTCTAGGGGGACCAGArCAGGGAlGGGGGlAl Gl iG ItALl 



i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i m i i i i i i i i i i i i i i i i 


Db 

2461 

TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 

2520 

Qy 

2521 

CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGA1 GGGG 1 G 1 i GGGG 1 AAAGGGGGCxftl IjI 1 



1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

2521 

CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 

2580 

Qy 

2581 

AC TCATGTC AGGGAATTGGGGGT TGAGGAAGC ACAGGCGC TGGC AGGAATAAAGA1 GAG 1 

Z D^l U 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

2581 

ACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCAGGAATAAAGATGAGT 

2640 

Qy 

2 641 

GAGACAGACAAGGCTATTGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACAGG 

z / uu 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

2641 

GAGACAGACAAGGCTATTGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACACC 

2700 

Qy 

2701 

TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGIGAGGAGG1 

z i bu 


I 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 M 1 1 1 1 


Db 

2701 

TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 

2760 

Qy 

2761 

C AT T C T C AGAGGGT GAC T C AGGT C AAC GTAGGGAC C C C C ATC TGGTC T AAAGAC AGAGC G 

ZoZU 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

2761 

CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 

2820 

Qy 

2821 

GTC C C AGGAT C T GC C ATGC GT T CGGGT GAGGAAC AT GAGG GAGG AC TGAGGG T AC C C C AG 

ZooU 



1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 


Db 

2821 

GT C C C AGGAT C T GC CAT GG G T TC G GGTGAGGAAC AT GAGGGAGGAC T GAGGG T AC C C C AG 

2880 

Qy 

2881 

GAC CAGAAC AC TGAGGGAGAC TGC ACAGAAATCAGC CC TGCC CC TGC T GTCACCC C AGAG 

o Q a n 

z y 4 u 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 


Db 

2881 

GAC CAGAACAC TGAGGGAGAC TGCACAGAAATCAGC CC TGC CCC TGCT GTCACCCC AGAG 

2940 

Qy 

2941 

AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 

JUUU 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

2941 

AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 

3000 

Qy 

3001 

AC GGGGAGGC C T T GG TC T G AGAAGGC TGC GC TC AGG T C AG T AGAGGGAGC GT C C C AGGC C 

oUOU 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3001 

ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 

3060 

Qy 

3061 

CTGCCAGGAGTCAAGGTGAGGACCAAGCGGGCACCTCACCCAGGACAOAI 1AA1 iLLAAl 

o±zu 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3061 

CTGCCAGGAGTCAAGGTGAGGACCAAGCGGGCACCTCACCCAGGACACATTAATTCCAAT 

3120 

Qy 

3121 

GAATTTTGATATCTCTTGCTGCCCTTCCCOAAGGAOC 1 AGGOAL-GIGi GGUL-ACjAI (j! 1 1 

O JL O U 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 


Db 

3121 

GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 

3180 

Qy 

3181 

GTCCCCTCCTGTCCTTCCATTCC I lAl^AIGGAlGlGAAU 1L. 1 1 oAl 1 HjvjAI 1 iUA^a 




i i i i i i i i i i i t i i i i i i i i i i i l l t l l l 1 1 1 t 1 1 l t l 1 l l l t 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 
M 1 1 II 1 II 1 1 1 1 11 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 


Db 

3181 

GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 

3240 

Qy 

3241 

ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 

3300 



1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3241 

ACC AGCAAAAGGGC AGGAT CCAGGCCC TGCCAGGAAAAAT AT AAGGGCCCTGCGTGAGAA 

3300 
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Qy 3301 C AGAGGGGGTC ATC C AC T GCATGAGAGT GGGGAT GT C AC AGAGT C C AGC C C AC C C T C C T G 3360 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I 
Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 C T T CC TGGAGC TCC AGGAAC C AGG C AGTGAGGC C T T GGTC T GAG AC AG TATC C T C AGG TC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 3421 C T T CC TGGAGC TCC AGGAAC CAGGC AGTGAGGC C T T GGT C TGAGAC AG TAT C C T C AGGTC 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 AC AGAGC AGAGGAT G C AC AGGGT G TGC C AGC AGT GAAT GT T T GC C C T GAAT GC AC AC C AA 3540 

Qy 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

I | I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 GGGCC C C AC C T GCC AC AGG AC AC AT AGG AC T C C AC AGAG T C TGGC C TC AC C T CC C T AC TG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T TCAGGTTT TCAGGGGACAGGCCAAC CCAGAGGACAGGATTC CC TGGAGGCC AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 3661 CC T TCAGGT TT TCAGGGGACAGGC CAAC CCAGAGGAC AGGAT TC CC TGGAGGCCAC AGAG 3720 

Qy 3721 GAGC AC C AAGGAGAAGATC T GT AAGT AGGC C T T T GT T AGAGT C T C C AAGGT T CAGT T C TC 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGC AC C AAGGAGAAGATC T GTAAGT AGGC C T T TG T T AGAGTC T C C AAGGT T CAGT T C T C 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I j I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 CC T GC C C AC AC T CC T GC C T GC TGC C C T G AC GAGAGT C ATC ATGT C T C T T GAGC AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 CC T GC C C AC AC TCCTGCCTGCTGCCCT GAC GAGAGT C AT C AT GT C TC T T GAG C AGAGGAG 3900 

Qy 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 TC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGGCC C T GGGC C T GG TG TG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 39 61 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 C AC T GC T GGGT C AAC AGAT CC T CC C C AGAGT C C T C AGGGAGC C T C CGC C T T T C C C AC TAC 4080 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
Db 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

Qy 4081 CAT CAAC T T C AC TC G AC AGAGGCAAC C C AGTGAGGG T TC C AGC AGCC G TGAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT CAAC T TC AC T C GAC AGAGGCAAC C C AG T G AGGG T TC C AGC AGC C G TGAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I ! I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AATGC T GGAGAGTGT C ATC AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC 4320 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I 
Db 4261 AATGC TGGAGAGTGTCATCAT^AAATTAC AAGC AC TGTTTTCCTGAGATCTTC GGC AAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I It I I I I I I I I I I I I I I 
Db 4 381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

Qy 4 501 C C ATGC T C C TGAGGAGGAAAT C TGGGAGGAGC T GAG TG T GATGGAGGT GT AT GATGGGAG 4 560 

I I I I II I I I I I I M II I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 4501 CCATGC T CC TGAGGAGGAAATC TGGGAGGAGC TGAGTGTGATGGAGGTGT AT GATGGGAG 4560 

Qy 4561 GGAGCAC AGTGCC TATGGGGAGCC C AGGAAGC TGCT CACC C AAGATT T GGTGCAGGAAAA 4620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I 
Db 4561 GGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAA 4620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 4 681 C C AAGGGC C C T C GC T GAAAC CAGC TAT G T GAAAG TC C T T GAGT AT GT GAT C AAGGT C AGT 4740 

Qy 4741 GC AAG AG TTCGCTTTTTCTTCC CAT C C C T GC G T GAAGC AGC T T T G AGAGAGG AGG AAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCTTCC C AT CC C T GC GT GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGT C T GAGC AT GAGTTGC AGC C AAGGC C AG T GGGAGGGGGAC T GGGC C AG T GC AC C T T 4860 

Qy 4 861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4921 GAAGAGAGC GG TC AG T GT T C TC AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGC GG T C AG TGT T C T C AGTAGT AGGT TT C T GT TC TAT T GGGT GAC T TGGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 
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Db 5101 T AAGAGT CTTGTGTTT TAT TC AGAT TGGGAAAT C CAT T C T ATT T TG TGAAT T GGGATAAT 5160 

Qy 5161 AACAGCAGTGGAATAAGTACTTAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 5161 AAC AGC AGTGGAAT AAGT AC T TAGAAAT GTGAAAAATGAGC AGT AAAAT AGATGAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG TC AAT T C T T GC C T TAT AC C T C AGT C TAT TC TG TAAA 5280 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I 
Db 5221 AGAAC TAAAGAAAT T AAGAGAT AG TC AAT T C T T GC C T T AT ACC T C AGT C TAT TC TG TAAA 5280 

Qy 5281 AT T T T T AAAGAT AT ATGC AT AC C T GGAT TTCCTTGGCTTCTTT GAGAAT GT AAGAG AAAT 5340 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 5281 AT T T T T AAAGAT AT ATGC AT AC C T GGAT T TCC T TGGC T T C T T T GAGAAT GTAAGAG AAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C T AAAGATG T AGGGAAAAGT GAGAGAGGGG T GAG GGT G T GGGGC TCC GGG T GAG AGT G 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C T C T AAAGAT G T AGGGAAAAGT GAGAGAGGGG TGAGGGT G T GGGGC TCC GGG T GAGAGTG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 
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0; 


Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 C T C TC AAC C C AGGGAAGC C CAGGT GCC C AGAT GT GAC GC C AC TGAC T T GAGC AT TAGT GG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 C T C TC AAC C C AGGGAAGC C CAGGT GC C C AGAT GTGAC GC C AC T GAC T T GAGC AT TAGT GG 180 

Qy 181 TTAGAGAGAAGCGAGGTTT TCGGTC TGAGGGGCGGC TTGAGATCGGTGGAGGGAAGCGGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 T TAGAGAGAAGC GAGGT T T T C GGT C TGAGGGGC GGC T TGAGAT C GGTGGAGGGAAG C GGG 240 

Qy 241 C C C AGC T C T GT AAGGAGGC AAGGT GAC ATGC TGAGGGAGGAC T GAGGAC C C AC T T AC C C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CCC AGCT C TGT AAGGAGGC AAGGT GACATGC TGAGGGAGGAC TGAGGACCCAC T TACCCC 300 

Qy 301 AGAT AGAGGAC CCC AAATAATCCCTTCATGCCAGTCCTGGAC CATC TGGTGGTGGACTTC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AG AT AGAGGAC C C C AAAT AAT C C C T T C ATGC C AG T C C T GG AC CATCTGGTGGT GGAC T T C 360 

Qy 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 CTCCGTGT GAT C AGG GAAGGGC TG C T TAGGAGAGGGC AGC G T C C AGGC T C T GC C AGAC AT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTCCGTGT GAT C AGG GAAGGGC TG C T TAGGAGAGGGC AGC G T C C AGGC T C T GC C AGAC AT 480 

Qy 481 CAT GC T C AGGAT TC T C AAGGAGGGC TGAGGGTC C C T AAGAC C C C AC TC C C GT GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CAT GC T C AGGAT TC T C AAGGAGGGC TGAGGGTCC C T AAGAC C C C AC T C C C G T GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 C C AGGAAAC AT CC GGG TGC CC GGAT GTGAC GC C AC T GAC T T GC G CAT T G T GGGGC AGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 C C AGGAAAC AT C CGGGTGCCCGGATGTGAC GCC ACT GAC TTGCGC AT TGT GGGGC AGAGA 780 

Qy 781 GAAGCGAGG T T TC C AT TC T GAGGG AC GGCGTAGAGT TC GG CC GAAGGAACC T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GAAGCGAGGT T TCC AT TC T GAGGGAC GGC GT AGAGT T C GGC C GAAGGAAC C T GAC C CAGG 840 
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Qy 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I II I I I I I 

Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I E I I I II I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 961 C GT C T C AGC C T GGGC TGC C CC C AGAC C C C TGC TC C AAAAGC C T T GAGAGAC ACC AGG T TC 1020 

Qy 1021 TTC TC C C C AAGC TC T GGAATC AGAGGT T GC T G TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

I I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 TT C TC C C C AAG C TC T GGAATC AGAGGT T GC TG TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I II I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGT TTGCCCCTGCTCT C AAC C C AGGGAAGC C C T GGT AGGC C C GAT GTG AAAC C AC T GAC T 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGT T T GC C C C T GC TC T C AAC C C AGGGAAGC C C T GGT AGGC C C GAT GTGAAAC C AC T GAC T 1440 

Qy 1441 TGAACC TCACAGATC TGAGAGAAGCCAGGTTCATTTAATGGTTCTGAGGGGCGGCT TGAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1441 TGAAC C T C AC AGAT C TGAGAGAAGC C AGGT T CAT T T AATGGT T C TGAGGGGC GGC T T GAG 1500 

Qy 1501 AT C C AC T GAGG GGAG TGGT T T TAGGC TC T GT G AGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 AT C C AC T GAGGGGAG TGGT T T TAG GC TC T GTGAGGAGGC AAGG T GAGAT GC T GAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAATGAT C C AG T AC C AC C C C T GC TG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AC T GAGG AGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT C C AGTAC C AC C C C T GC T G 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 CCAGCCCTGGACCACCCGGCC AGGAC AG ATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 
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I 1 I I I I I I I I I I I I 1 I I I I I I I I I I I I 1 I I I I i I I i I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

I I I I I I I I ! I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

Qy 1861 CC AC T C AC AT T C C CAT AC C T ACC C C C T ACC C C C AACC T CATC T T GTC AGAAT C CC T GC TG 1920 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGGTCTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAGAGGGAGGGCCCTAC 2040 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 1981 GGGTCTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAGAGGGAGGGCCCTAC 2040 

Qy 2041 T GC GAGAT GAGGGAGGC C T C AGAGGAC C C AGC AC C C T AGGAC AC C GC AC C C C T GT C TGAG 2100 

I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2041 T GC GAGAT GAGGGAGGCC T C AGAGGAC C C AGC ACCC T AGGAC AC C GC AC C C C T GT C TGAG 2100 

Qy 2101 AC T GAGGC TGC C AC T T C TG GC C TC AAGAAT C AGAAC GAT GGGGAC T C AGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC T GAGGC T GC C AC T T C T GGC C T C AAGAAT C AGAAC GATGGGGAC T C AGAT T GC AT GGGG 2160 

Qy 2161 GTGGGAC CCAGGCC TGCAAGGCT TAC GC GGAGGAAGAGGAGGGAGGAC TCAGGGGACC T T 2220 

I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I 

Db 2161 GTG GGAC C C AGGC C T GC AAGGC T TAC GC GGAG GAAGAGGAGGGAGGAC T C AG GGGAC C T T 2220 

Qy 2221 GGAATCC AGAT CAGTGTGGACCTCGGCCC TGAG AGGTCCAGGGCACGGTGGCC AC ATATG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAATC C AGAT C AGT GT GGAC CTCGGCCCT GAGAGG T C C AGGGC AC GG T GGC C AC AT AT G 2280 

Qy 2281 GC C CAT AT T T C C T GC ATC T T TGAGGT GAC AGGAC AGAGC T GT GG T C T GAGAAG T GGGGC C 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GC C CAT AT T T C C T GC ATC T T TGAGGT GACAGGAC AG AGC T GT GG T C T GAGAAGT GGGGC C 2340 

Qy 2341 T C AGGT C AAC AGAGGGAGGAGTT C C AGGAT C CAT AT GGC C CAAGAT GT GC C C C C T T C ATG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2341 T C AGGT C AAC AGAGGGAGGAGTT C C AGGAT C C AT AT GGC C C AAGAT GT GCC C C C T T CAT G 2400 

Qy 2401 AGGAC T GGGGAT AT C C C C GGC TC AGAAAGAAG GGAC TC CAC AC AGT C T GGC TGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 24 60 

Qy 24 61 T TAG TAG C T C T AGGGGGAC C AGAT C AGGGAT GGC GG TAT G T T CC AT T C T CAC T T G T AC C A 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 TTAGTAGCTCT AGGGGGAC CAGATCAGGGATGGCGGTATGTTCC AT TCTCACTTGT AC CA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTT GGGG TAAAGGGGGGAT GTC T 2580 

Qy 2581 AC T CAT G TC AGGGAAT T GGGGGT T GAGG AAGC AC AGGC GC T GGC AGGAAT AAAGAT GAGT 2 640 

I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AC T CAT G T C AGGGAAT T GGGGGT T GAGGAAGC AC AGGC GC T GGC AGGAAT AAAGAT GAGT 2640 

Qy 2641 GAGAC AG AC AAGGC TAT T GGAATC CAC ACC CC AGAAC C AAAGGGGTC AGCCC T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 2641 GAGAC AGAC AAGGC TAT TGGAATC C AC AC C CC AGAAC C AAAGGG GTC AGC C C TGGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 27 61 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I 
Db 27 61 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2821 GTC C C AGGAT C T GCC ATGC GTTC GGGT GAGGAAC AT GAGGGAGGAC T GAGGG T AC C C CAG 2880 

Qy 2881 GAC C AGAAC AC T GAGGGAGAC TGC AC AGAAAT CAGC C C TGC C C C TGC T GTC AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GAC CAGAAC AC T GAGGGAGAC TGC AC AGAAAT CAGC CCTGCCCCTGCT GTC AC C C C AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 AC GGGGAGGC C T TGG T C T GAGAAGGC TGC GC T C AGGT C AG T AGAGGGAGC GT C C C AGGC C 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C T GCC AGGAGT C AAGGTGAGGAC C AAGC GGGC AC C T C AC C C AGGAC AC AT TAAT T C C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 30 61 C T GC C AGGAG T C AAGGTGAGGAC C AAGC GGGC AC C T C AC C C AGGAC AC AT TAAT T C CAAT 3120 

Qy 3121 GAAT T T T GAT AT C TC T TGC TGCCCTTCCC C AAGGAC C T AGGC AC GTGT GGC C AGATGT T T 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 324 0 

Qy 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 AC CAGC AAAAGGGC AGGAT C C AGGC CC T GC C AGGAAAAAT AT AAGGGC C C TGC GT GAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 G T AGC AC T GAG AAGC C AGGGC T GT GCT T GC GG T C T GC AC C C T GAGGGC C C G T GGAT T C C T 3420 

Qy 3421 C T T C C T GGAGC TC C AGGAACC AGG CAG T GAGGC C T T GGTC TGAGAC AG TATC C T C AGGTC 3480 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I 
Db 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

Qy 3541 GGGCC C C AC C T GC C AC AGGAC AC AT AGGAC TC C AC AGAG T C T GGC C T C AC C T C CC T AC T G 3600 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 3541 GGGCCCCACC TGC CACAGGACACAT AGGAC TCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 
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Qy 

3601 

TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGC 1G1 AOoC lGAGlAUCCLU 1 LAL 1 ltt 1 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3601 

TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 

3660 

Qy 

3661 

C C T TC AGGTT T TC AGGGGAC AGGC C AAC C C AGAGGAC AGGAT TC C C TGGAGGC C AC AGAG 

J / zu 


I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3661 

C C T T C AGGT T T T C AGGGGAC AGGC C AAC CC AGAGGAC AGGATT C CC T GGAGG C C AC AGAG 

3720 

Qy 

3721 

GAGC AC C AAGGAGAAGAT C TGTAAGT AGGC C T T T GT T AGAGTC T C C AAGGT T C AGT T C T C 

o ^ q n 
o / oU 


1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 


Db 

3721 

GAGCACCAAGGAGAAGATC TGTAAGTAGGCCT TTGT TAGAGTCTCCAAGGTTCAGT TCTC 

3780 

Qy 

3781 

AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 



I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 


Db 

3781 

AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 

3840 

Qy 

3841 

CC T GC C C AC AC TC C T GC C T GC TGC C C TGAC GAGAGT C AT C ATGT C TC T T GAG C AGAGGAG 

6 yuu 


I | 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3841 

CC T GC C C AC AC TCCTGCCTGCTGCCCT GAC GAGAGT CAT C ATGT C T C T TGAGC AGAGGAG 

3900 

Qy 

3901 

TC T GC AC TGC AAGCC TGAGGAAGC C C T T GAGGC C C AAC AAGAGGC C C T GGGC CT GG TGTG 

o y bu 


I | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3901 

TC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGG CC C AAC AAGAGG C C C T GGGC C TGG TGTG 

3960 

Qy 

3961 

TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 

a r\ o n 
H UZU 


I 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

3961 

TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 

4020 

Qy 

4021 

C AC TGC T GGGT C AAC AGAT C C T CC C C AGAGTC C TC AGGGAGC CTCCGCCTT T CC C AC T AC 

a n o n 


I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 


Db 

4021 

CAC TGC T GGGT CAAC AGAT CCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCC AC TAC 

4080 

Qy 

4081 

CAT CAAC T T CAC T C GAC AG AGGC AAC C C AG T GAGGG T T CCAGCAGC C G TGAAGAGG AGGG 

4140 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 I 


Db 

4081 

CAT CAAC T TC AC T C GAC AG AGGC AAC C C AGTGAGGG T TC C AGC AGC C G T GAAGAGGAGGG 

4140 

Qy 

4141 

GC C AAGC AC C T C T TGTAT C CTGGAGT CCTTGT T CC GAGC AGTAATC AC TAAG AAGGT GGC 

4200 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

4141 

GCC AAGC ACCTCTTGTATCCTGGAGTCC TTGT TCCGAGCAGTAATCACTAAGAAGGTGGC 

4200 

Qy 

4201 

T GAT T TG GT TGGT T T TC T GC TC C T CAAAT AT C GAGC C AGGGAGC C AGT CAC AAAGGCAGA 

a o ez n 


I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

4201 

TGAT T TGGT TGGT T T TC TGC TCCTCAAATATC GAGC C AGGGAGC CAGT CAC AAAGGCAGA 

4260 

Qy 

4261 

AAT GC T GGAGAGT GT CAT C AAAAAT TAC AAGC AC TGTTTTCCT GAGATC T T C GGC AAAGC 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 


Db 

4261 

AAT GC T GGAGAGT GT CATC AAAAAT TAC AAGC AC TGTTTTCC TGAGAT C T T C GGCAAAGC 

4320 

Qy 

4321 

C T C TGAG T C C T T GC AGC T GGTC T T TGGC AT T GAC GT GAAGGAAGC AGAC C C L AO O bbL u A 

a t ft n 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

4321 

CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 

4380 

Qy 

4381 

CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGA1GGOL IbLlbbbibAl AA1UA 

A A a n 


■ ■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

4381 

CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 

4440 

Qy 

4441 

GAT CATGCCCAAGACAGGCTTCCTGATAATTGTCCT GGTC ATGAT TGC AATGGAGGGCGG 

4500 



II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 M 1 1 1 1 1 1 1 1 1 1 


Db 

4441 

GAT CAT GC C C AAGAC AGGC T TC C T GAT AAT T G T C C T GGTC AT GAT T GC AATGGAGGGC GG 

4500 
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Qy 4 501 CCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAG 4560 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I 
Db 4501 C CAT GC T C C TGAGGAGGAAATC TGGGAGGAGC TGAG TGTGATGGAGGT GT AT GATGGGAG 4560 

Qy 4 561 GGAGC AC AGT GCC TATGGGGAGC C C AGG AAGC TGC T C ACC C AAGAT T T GGT G C AGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 561 GGAGC AC AGT GCC TATGGGGAGC C C AGGAAGC TGC T C ACC C AAGAT T T GGT G C AGGAAAA 4 620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 4741 GC AAGAGT TCGCTTTTTC T TCC C AT C C C TGCG T GAAGC AGC TT T GAGAGAGG AGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCT TC CC ATCC C T GCGTGAAGCAGC TT T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 48 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 4 8 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4 921 GAAGAGAGC GG TC AGTGT T C T C AG TAGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4 980 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 921 GAAGAGAGC GG TC AGTGT T C T C AG TAGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4 980 

Qy 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 T TC AGC ATCC AAGT T T ATGAATGAC AGC AGTC AC AC AGT T C TGT GTAT AT AGT T TAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 5041 T T C AGC AT C C AAGT T TATGAAT GAC AGC AG T C AC AC AGT T C TGT GTAT AT AG T T TAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

Qy 5161 AAC AGCAGTGGAATAAGTAC T TAGAAAT GTGAAAAATGAGC AGT AAAATAGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AGT GGAAT AAGT AC T TAGAAAT GT GAAAAAT GAGC AGT AAAATAGATGAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AAT TC T T GC C T TAT AC C T C AGT C TAT T C T G T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC TAAAGAAAT T AAGAGAT AG T C AAT T C T T GC C T TAT AC C T CAGT C TAT T C TG T AAA 5280 

Qy 5281 AT T T T T AAAGATAT AT GC ATACC T GGAT T T C C T TGGC T T C T T T GAGAATGTAAGAGAAAT 5340 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T TT T AAAGATAT ATGC AT AC C T GGAT T TC C T TGGC T TC T T T GAGAAT GT AAGAG AAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 
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Db 

5401 

Qy 

5461 

Db 

5461 

Qy 

5521 

Db 

5521 

Qy 

5581 

Db 

5581 

Qy 

5641 

Db 

5641 


I 11 I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

C C AC C C ATAGGGT CG TAGAGTC T AGGAGC TGC AGTC AC G T AATC GAGG T GGC AAGAT GTC 5520 
I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I 
CCACCCATAGGGTCGTAGAGTCTAGGAGC TGC AGTC ACGT AATC GAGGTGGCAAGATGTC 5520 

C TC T AAAGATG T AGGGAAAAGTGAGAGAGGGG TGAGGGT GT GGGGC TC C GGG T GAGAGTG 5580 
I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I II I I II 
C TC T AAAGATG T AGGGAAAAGTGAGAGAGGGG T GAGGGT G T GGGGC TC C GGG TGAGAGT G 5580 

GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

GGGGGAGC TGAT T GT AAT GAT C T T GGGT GGAT C C 5674 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGGGAGC TGAT T GT AAT G ATC T T GGGT GGAT C C 5674 
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VERSION 
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SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 


TITLE 

JOURNAL 
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REFERENCE 
AUTHORS 
TITLE 
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COMMENT 


AC152005 88597 bp DNA linear PRI 20-OCT-2004 

Homo sapiens chromosome X clone CTC-233olO map q28, complete 
sequence . 
AC152005 

AC152005.1 GI: 54306089 
HTG. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 

1 (bases 1 to 88597) 

Mallon,A.M., Platzer,M., Bate,R., Gloeckner , G . , Botcherby, M. R . , 
Nordsiek,G., Strivens, M. A. , Kioschis,P., Dangel,A., Cunningham, D. , 
Straw, R.N., Weston, P., Gilbert, M. , Fernando,S., Goodall,K., 
Hunter, G. , Greystrong, J. S . , Clarke, D., Kimberley, C . , Goerdes,M., 
Blechschmidt, K. , Rump, A., Hinzmann,B., Mundy,C.R., Miller, W., 
Poustka,A., Herman, G.E., Rhodes, M. , Denny, P., Rosenthal, A. and 
Brown, S .D. 

Comparative genome sequence analysis of the Bpa/Str region in mouse 
and Man 

Genome Res. 10 (6), 758-775 (2000) 
10854409 

2 (bases 1 to 88597) 
Lagemann,D. and Platzer,M. 
Direct Submission 

Submitted (20-OCT-2004 ) Genome Analysis, Institute of Molecular 
Biotechnology, Beutenbergstr . 11, Jena, Thuringia 07745, Germany 
Genome Center 

Center: Institute of Molecular Biotechnology 

Center code: 1MB 

Web site: http://genome.imb-jena.de/ 

Contact : gsc j -submit@genome . imb- j ena . de 
Project Information 

Center project name: 233o 

Center clone name: CTC-233olO 
Summary Statistics 

Sequencing vector: M13mpl8; 100% of reads 

Chemistry: Dye-terminator Big Dye; 100% of reads 
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Assembly program: Phrap; version 0.990329 
Consensus quality: 88596 bases at least Q40 
Consensus quality: 88597 bases at least Q30 
Consensus quality: 88597 bases at least Q20 
Quality coverage: 21.98x 


This sequence was finished as follows unless otherwise noted: all 
regions were double stranded, sequenced with an alternate 
chemistry, or covered by high quality data {i.e., phred quality >= 
30); an attempt was made to resolve all sequencing problems, such 
as compressions and repeats; all regions were covered by at least 
one plasmid subclone or more than one M13 subclone; and the 
assembly was confirmed by restriction digest. 


Neighboring sequence information: 

This clone is overlapped by RP11-76K17, G248-85942H2 , G248-86799C8, 
QC-15B1, QC-3H10, QC-13B12. 


Sequence Quality Assessment: 
This entry has been annotated with sequence quality 
estimates computed by the Phrap assembly program. 
All manually edited bases have been reduced to quality zero. 
Quality levels above 40 are expected to have less than 
1 error in 10,000 bp. 

Base-by-base quality values are not generally visible from the 
GenBank flat file format but are available as part 
of this entry 1 s ASN.l file. 


Location/Qualifiers 
1. .88597 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref="taxon:9606" 

/ chr omo s ome= "X" 

/map="q28" 

/clone="CTC-233ol0" 

1. .8123 

/organism="Homo sapiens" 
/mo l_type= "genomic DNA" 
/db_xref="taxon:9606" 
/clone="G248-85942H2" 
/note="overlapping clone" 
1. .14265 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9606" 
/clone="G248-86799C8" 
/note="overlapping clone" 
1. .35153 

/organism="Homo sapiens" 
/mol_type="genomic DNA" 
/db_xref ="taxon: 9606" 
/clone="RPll-7 6K17" 
/note="overlapping clone" 
49506. .88597 
/organism="Homo sapiens" 
/mol_type="genomic DNA" 
/db_xref="taxon:9606" 
/clone="Qc-15Bl" 
/note="overlapping clone" 
63059. .88597 


FEATURES 

source 


source 


source 


source 


source 


source 
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/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref="taxon:9606" 

/clone="Qc-3H10" 

/note="overlapping clone" 
source 84876. .88597 

/organism="Homo sapiens" 

/mo^type^" genomic DNA" 

/db_xref ="taxon: 9606" 

/clone="Qc-13B12" 

/note="overlapping clone" 
misc_feature 3461. .3739 

/note="pcr product sequence only" 
misc_feature 46152. .46248 

/note="single stranded/single chemistry region" 

ORIGIN 

Query Match 98.1%; Score 5567.8; DB 5; Length 88597; 

Best Local Similarity 99.6%; Pred. No. 0; 

Matches 5655; Conservative 0; Mismatches 17; Indels 7; Gaps 7; 


Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I E I II I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I 
Db 58574 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 58515 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 58514 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 58455 

Qy 121 C T C T C AAC C C AGGGAAGC C C AGGT GC C C AGAT GT GAC GC C AC T GAC T T GAGC AT T AGT GG 180 

I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I II 
Db 58454 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 58395 

Qy 181 T T AGAGAGAAGC GAGGT T T TC GGT C T GAGGGGC GGC T T GAGAT C GGT G GAGG GAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 58394 T TAGAGAGAAGC GAGGT TTTC GGT CT GAGGGGC GGC TT GAGAT C GGT GGAGGGAAGC GGG 58335 

Qy 241 CCC A- GC TC T GTAAGGAGGCAAGGTGACAT GC TGAGGGAGGAC TGAGGACC CAC T TACC C 29 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 58334 CCCAGGCTCTGTAAGGAGGCAAGGTGACATGC TGAGGGAGGAC TGAGGACCC AC TTACCC 5827 5 

Qy 300 C AGAT AG AGGAC C C C AAAT AAT CC C T T C ATGC C AGT C C T GGAC C AT C T GGT G GTGGAC T T 359 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 58274 CAGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTT 58215 

Qy 360 C T C AGGC T GGGC C AC C C C C AGC CC C C T T GC TG C T T AAAC C AC TGGGGAC T C GAAGT C AGA 419 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 58214 CTCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCTGAAGTCAG 58155 

Qy 420 GC T CC GT GT GATCAGGGAAGGGC T GC T T AGGAGAGG GC AGC GT C C AGGC T C T GC C AG AC A 479 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 58154 AGC TC G T GT GAT C AGGGAAGGGC T GC T T AGGAGAGGGC AG C GT C C AGGC T C T GC C AGAC A 58095 

Qy 480 TCATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAA 539 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I 
Db 58094 T C ATGC T CAGGAT T C T C AAGGAGGGC TGAGGG T CC C T AAG AC C C C AC TC C C G T GAC C C AA 58035 

Qy 540 CCCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCC 599 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 58034 CCCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCC 57975 
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Qy 600 ACCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCC 659 

I I I I I I I II I I I I I f i I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
Db 57974 ACCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCC 57915 

Qy 660 TCACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCC 719 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57914 TCACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCC 57855 

Qy 720 GCCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAG 779 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57854 GCCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAG 57795 

Qy 780 AGAAGC GAGGT T TC C AT TC TGAGGGAC GGC GT AGAG TTC GGC C GAAGGAAC C TGAC CC AG 839 

I I I I I I I I I I I 1 I I II I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57794 AGAAGC GAGGT T TC C AT T C TGAGGGACGGC GT AGAG TT CGGC CGAAGGAAC C TGAC CC AG 57735 

Qy 840 GC T C TGT GAGGAGGC AAGGTGAGAGGC T GAGGGAGGAC T GAGGAC CC C GC C AC T CC AAAT 899 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 ii 1 1 1 1 it 1 1 1 1 1 

Db 57734 GCTC TGT GAGGAGGC AAGGTGAGAGGC TGAGGGAGGACTGAGGACCCCGCC AC TCC AAAT 5767 5 

Qy 900 AGAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAG 959 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 57674 AGAGAGCCCCAAATATTCCAGCGCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAG 57615 

Qy 960 ACGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTT 1019 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57 614 ACGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTT 57 55 5 

Qy 1020 C T T C TCC CCAAGC TC TGGAATCAGAGGT TGCT GTGACCAGGGCAGGAC TGGT TAGGAGAG 107 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57554 C TTC TCC CCAAGC TC TGGAATCAGAGGT TGCT GTGACCAGGGCAGGAC TGGT TAGGAGAG 57495 

Qy 1080 GGCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCC 1139 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57494 GGCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCC 57435 

Qy 1140 CCCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAAC 1199 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57434 CCCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAAC 5737 5 

Qy 1200 CCCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCAC 1259 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 57374 CCCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCAC 57315 

Qy 1260 CACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAA 1319 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57314 CACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAA 5725 5 

Qy 1320 CCCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATC 137 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57254 CCCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATC 57195 

Qy 1380 CGGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGAC 1439 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57194 CGGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGATGGCCCGATGTGAAACCACTGAC 57135 

Qy 1440 T T GAACC T C AC AGAT C TGAGAGAAGCC AGGT T CAT T TAAT GGT T C TGAGGGGC GGC T T GA 1499 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 57134 TTGAACCTCACAGATCTGAGAGAAGCCAGGTT CAT T TAAT GGT TCTGAGGGGCGGCTTGA 5707 5 

Qy 1500 GAT C C AC T GAGGGGAGTGG T T T TAGGC T C T GT GAGGAGGC AAGG T GAG AT GC TGAGGGAG 1559 
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I I I M I II I I I I I t I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 57074 GAT C C AC TGAGGGGAGTGG T T T T AGGC T C TGT GAGGAGGC AAGGTGAG AT GC TGAGGGAG 57015 

Qy 1560 GAC TGAGGAGGCACACACCCCAGGTAGATGGCCCCAAAATGATCCAGTACCACCCC TGCT 1619 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I 
Db 57014 GAC T GAGGAGGC AC AC AC C C C AGG T AGATGGC C C C AAAAT GAT C C AGT ACC AC CCC TGC T 56955 

Qy 1620 GCCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTC 167 9 

I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
Db 56954 GCCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTC 56895 

Qy 1680 CCACTGCCAC T TAACCCACAGGGCAATC TGTAGTCATAGC TTATGTGACCGGGGCAGGGT 1739 

M I I II I I I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 56894 CCAC TGC CACT TAACCCACAGGGCAATC TGTAGTCATAGC TTATGTGACCGGGGCAGGGT 56835 

Qy 1740 TGGTCAGGAGA-GGCAGGGCCCAGGCATCAAGGTCCA-GCATCCGCCCGGCATTAGGGTC 17 97 

I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I II I I I I I II I II I I I 
Db 56834 TGGTCAGGAGAGGGCAGGGCCCAGGCATCAAGGTCCAGGCATCCGCCCGGCATTAGGGTC 56775 

Qy 1798 AGG AC C C T GGGAGGGAAC T GAGGG T TC C C C AC C C AC AC CTGTCTCC T C ATC T C C AC C GC C 1857 

I I I I I I I I I I I I I I II I I I I I I I II I I I I II I I I II I I I I I I I I I I II I II I I I I I I I I I 
Db 5 6774 AGGAC C C T GGGAGGGAAC T GAGGG T TC C C C AC C C AC AC C T GT C T C C TC ATC T C C AC C GCC 56715 

Qy 1858 ACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTG 1917 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I 
Db 56714 ACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTG 56655 

Qy 1918 CTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCAT 1977 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 56654 C T G T C AAC C C AC GGAAGC C AC GGGAATG GC GG C C AGGC AC T C GGATC T TGAC GT CC C CAT 56595 

Qy 1978 CCAGGGTC TGATGGAGGGAAGGGGC TTGAACAGGGC C TC AGGGGAGCAGAGGGAGGGCCC 2037 

I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 56594 CCAGGG-CTGATGGAGGGAAGGGGCTTGAACAGGGCCTCAGGGGAGCAGAGGGAGGGCCC 56536 

Qy 2038 TAC T GC G AGAT GAGGGAGGC C T C AGAGGAC C C AGC AC C C T AGGAC AC C GCAC CCCTGTCT 2097 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 56535 TAC TGCG AGAT GAGGGAGGCCTCAGAGGACCC AGC ACCCT AGGAC ACC GCAC CCCTGTCT 56476 

Qy 2098 GAG AC T GAGGC TGC C AC T T C TGGC C TC AAGAAT C AG AAC GAT GGGGAC T C AGAT T - GC AT 2156 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5 6475 GAGACT GAGGC TGC C AC TTCTGGCCTC AAGAAT CAGAAT GAT GGGGAC TCAGATTAGC AT 56416 

Qy 2157 GGGGGTGGGAC CCAGGCC T GC AAGGCT T ACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGA 2216 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I II I 
Db 56415 GGGGGTGGGAC C CAGGCC T GC AAGGCT T ACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGA 56356 

Qy 2217 C C T T GGAAT C C AGAT CAGT GT GGAC C T C GGC C C T GAGAGG T C C AGGGC AC GG TGGC C AC A 2276 

I I I I II I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I 

Db 56355 C C T T GGAAT C C AGAT C AGT GT GGAC C T C GGC C C T GAGAGG T C C AGGGC AC GG TGGC C AC A 56296 

Qy 2277 TAT GGC C CAT AT T T C C TGC ATC T T T GAGGT GAC AGGAC AG AGC T GT GG T C TG AGAAG TGG 2336 

II I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 1 I I I II I I I I I I I I I 

Db 56295 TAT GGCCCATATTTCC TGC ATC TTTGAGGTGAC AGGAC AGAGCTGTGGTCTGAGAAGTGG 56236 

Qy 2337 GGCCTCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTT 2396 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 56235 GGC C T C AGGT C AAC AGAGGGAGGAGT TC C AGGATC C ATAT GGC C C AAG AT GT GCCCCCTT 56176 

Qy 2397 C ATGAGG AC T G GGGAT AT C C C C GGC TC AGAAAGAAGGGAC TC C AC AC AG TC T GGCT GTC C 2456 

M I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I 


http://es/ScoreAccessWeb/GetItem.action? Appld=088 1 9669&seqld=6095 1 6&ItemName=us.. . 8/30/06 


Db 56175 CAT GAGGAC TGGGGATATC C CC GGC TC AGAAAGAAGGGAC TC C AC AC AGTC T GGC T GTC C 56116 

Qy 2457 CCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGT 2516 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I 
Db 56115 CCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGT 56056 

Qy 2517 ACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGAT 2576 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 56055 AC C AC AGGC AG GAAG T TGGGGGGC C C TC AGGG AGAT GGGG TC T TGGGG T AAAGGGGGGAT 55996 

Qy 2577 GTC TAC T CAT G TC AGGGAAT T GGGGGT T GAGGAAGC ACAGGCGC T GGC AGGAATAAAGAT 2636 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55995 GTC TAC T C AT GTC AGGGAAT T GGGGGT T GAGGAAGC AC AGGC GCT GGC AGGAATAAAGAT 55936 

Qy 2637 GAGTGAGACAGACAAGGC TAT TGGAATC CACACCCC AGAACCAAAGGGGTCAGCCC TGGA 2696 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55935 GAG TGAGAC AG AC AAGGC TAT TGGAATC C TC AC C CC AGAACC AAAGGGGT C AGC C C T GGA 5587 6 

Qy 2 697 CACCTCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGG 2756 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55875 CACCTCACCCAGGATGTGGCTTC-TTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGG 55817 

Qy 2757 ACCTCATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAG 2816 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 55816 AC C T CAT T C T C AGAGGGTGAC TCAGGT C AAC GT AGGGAC C CC CAT C TGGTC T AAAGACAG 55757 

Qy 2817 AGC GGT C C CAGGATC T GC C AT GC G T TC GGGT GAGGAAC AT GAGG GAGGAC T GAGGG TAC C 287 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55756 AGC GGTC C CAGGATC TGC CATGCG T TC GGGT GAGGAAC AT GAGGGAGGAC TGAGGG TAC C 55697 

Qy 2877 C C AGGAC CAGAAC AC TGAGGGAGAC TGC AC AGAAAT C AGC CC T G C C C C TGC T GTC AC C C C 2936 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55696 CCAGGACCAGAACAC TGAGGGAGAC TGCACAGAAATCAGCCCTGCCCC TGC TGTCACCCC 55637 

Qy 2937 AGAGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTC 2996 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55636 AGAGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTC 55577 

Qy 2997 AGGGAC GGGGAGGC C T T GG TC TGAG AAGGC T GC GC T C AGG TC AG T AGAGGGAGC GT C C C A 3056 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55576 AGGGAC G GGGAGGC C T T GG TC TGAGAAGGC T GC GC T C AGG TC AG T AGAGGGAGC GT C C C A 55517 

Qy 3057 GGC CC TGCCAGGAGT CAAGGTGAGGACC AAGCGGGCACC T CACC C AGGACAC AT TAAT TC 3116 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 55516 GGC CC TGC C AGGAGT CAAGGTGAGGACC AAGC GGGC ACC T CAC C C AGGAC AC AT T AATTC 55457 

Qy 3117 C AAT GAAT T T T GAT AT CTCTTGCTGCCCTTCCC C AAGGAC C T AGGC AC GT GT GGC C AGAT 3176 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55456 C AAT GAAT T T T GATATC T C T TGC TGCCCTTCCC C AAGGAC C T AGGC AC GTGT GGC C AGAT 55397 

Qy 3177 GTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTC 3236 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55396 GTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTC 55337 

Qy 3237 TCAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTG 3296 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55336 TCAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTG 55277 

Qy 3297 AGAAC AGAGGGGGTC ATC C AC T GC ATGAGAGT GGGG AT GT C AC AGAGT C C AGC C CACC C T 3356 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 55276 AGAAC AGAGGGGGTC ATCC AC TGC ATGAGAGT GGGGATGTC AC AGAGT CCAGCCCACCCT 55217 
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Qy 3357 C C T GGT AGC AC T GAGAAGC C AGGGC TGT GC T T GCGG T C T G C ACC C TGAGGGC C C GT GGAT 3416 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55216 C C T GGT AGC AC TGAGAAGC C AGGGC TGT GC T T GC GG T C T GC ACC C TGAGGGC C C G T GGAT 55157 

Qy 3417 TCCTCTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCA 3476 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 55156 TCCTCTTCC TG GAGC TC C AGGAAC CAGG C AGT GAGGC C T T GG TC T GAGAC AGTAT C C TC A 55097 

Qy 3477 GGTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACA 3536 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55096 GGTCACAGAGC AGAGGATGCACAGGGTGTGCC AGCAGTGAATGT T TGC CC TGAATGCACA 55037 

Qy 3537 C C AAGGGC C C C AC C T GCC ACAGGAC ACATAGGAC T C C AC AGAGT C TGGCC T C AC C T C C C T 3596 

I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 55036 C C AAGGGC C C C AC C T GCC AC AGGAC AC ATAGG AC T C C AC AGAGT C TGGCC T C AC C T C C C T 54977 

Qy 3597 ACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACT 3656 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54976 ACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACT 54917 

Qy 3657 TCCTCCTT C AG GT T T TC AGGGGAC AGGC C AAC C C AGAGGAC AGG AT TC CC T GGAGGC C AC 3716 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54916 TCC TCC T TC AGGT T T TC AGGGGAC AGGC C AAC CC AG AGGAC AGG AT TC CC TGGAGGCCAC 54857 

Qy 3717 AGAGGAGC AC C AAGGAGAAGAT C T GTAAGT AGGC C T T T GT T AGAGTC T CC AAGGT T C AGT 3776 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54856 AGAGGAGC AC C AAGGAGAAGATC T GTAAGT AGGC C T T T G T T AGAG TC T CC AAGGT T C AGT 54797 

Qy 3777 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 38 36 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54796 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 54737 

Qy 3837 AGC T C C T GC C C AC AC TCCTGCCTGCTGCCC TGAC GAGAGT C AT C ATGT C TC T T GAGC AG A 3896 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54736 AGC T C C T GC C C AC AC TCCTGCCTGCTGCCC TGAC GAGAGT C AT C ATGT C TC T T GAGC AGA 54677 

Qy 3897 GGAGT C T GC AC TGC AAGC C TGAGGAAGC C C T T GAGGC CC AAC AAGAGGCC C TGGGC C TGG 3956 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54676 GGAGT C T GC AC TGC AAGC C TGAGGAAGC C C T T GAGGC C C AAC AAGAGGCC C TGGGC C T GG 54617 

Qy 3957 TGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGG 4016 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54616 TGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGG 54557 

Qy 4017 TGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCA 407 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54556 TGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCA 54497 

Qy 4077 C T AC C AT C AAC T T C AC T C GAC AGAGGC AACC C AG TG AGGG T TC C AGC AGC C G T GAAGAGG 4136 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54496 CT ACC ATC AAC TTC AC TCG AC AGAGGC AACCCAGTGAGGGTTCC AGC AGCCGTGAAGAGG 54437 

Qy 4137 AGGGGCC AAGC ACC TCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGG 4196 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54436 AGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGG 54377 

Qy 4197 TGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGG 4256 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54376 TGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGG 54317 
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Qy 4257 C AGAAAT GC T GGAGAGTGT C ATCAAAAAT TAC AAGC AC TG T T T T CC TGAGAT C T TC GGC A 4 316 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54316 C AGAAAT GC T GGAGAGTGT C ATCAAAAAT TAC AAGC AC TGT T T T CC TGAGAT C T T C GGC A 54257 

Qy 4317 AAGC C TC TGAG TC C T TGCAGC TGG TC T T T GGC AT TGACGT GAAGGAAGC AGAC C C C ACC G 437 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I 1 I I I 
Db 54256 AAGCC TC TGAG TC C T TGCAGC TGG TC T T T GGC AT TGAC GT GAAGGAAGC AGAC C C C ACC G 54197 

Qy 4377 GCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATA 4436 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 54196 GCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATA 54137 

Qy 44 37 ATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGG 44 96 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54136 ATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGG 54077 

Qy 4497 GCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATG 4556 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54076 GCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATG 54017 

Qy 4557 GGAGGGAGCAC AGTGCC TATGGGGAGCC CAGGAAGC TGC T CACCCAAGATT T GGTGC AGG 4616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 54016 GGAGGGAGCAC AGTGC C TAT GGGGAGC C CAGGAAGC T GC T C AC C C AAGAT T T GGTG C AGG 53957 

Qy 4617 AAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGT 4675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 53956 AAAAGTACCTGGAGTACCGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGT 53897 

Qy 467 6 GGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGG 4 735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I 
Db 53896 GGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGG 53837 

Qy 4736 TCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTTGAGAGAGGAGG 4795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 53836 TCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTTGAGAGAGGAGG 53777 

Qy 4796 AAGAGGGAGTC TGAG C AT GAGT TGC AGCCAAGGCCAGTGGGAGGGGGACTGGGCC AGTGC 4855 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 53776 AAGAGGGAGTC TGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGC 53717 

Qy 4856 ACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTC 4915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 53716 ACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTC 53657 

Qy 4916 AC T C T GAAGAGAGC GGTC AGT GT T C T C AGT AG T AGG TTTCTGTTC TAT TGGG TGAC T TGG 4975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 53656 AC T C T GAAGAGAGC GGT C AGTGT T C T C AGT AG T AGG TTTCTGTTC TAT T GGG T GAC T TGG 53597 

Qy 4976 AGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAA 5035 

I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 53596 AGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAA 53537 

Qy 5036 TGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTT 5095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 53536 T GAAC TT C AGC ATC C AAGT T T ATGAAT GAC AG C AGT C AC AC AG T T C TG T GT AT AT AGT T T 53477 

Qy 5096 AAGGGT AAGAG TC T T GT G T T T TAT T C AG AT TGGGAAATC C ATT C TAT T T T GT GAAT TGGG 5155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 53476 AAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGG 53417 

Qy 5156 ATAATAACAGC AGTGGAAT AAGTAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGA 5215 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 53416 ATAATAACAGC AGTGGAAT AAGTAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGA 53357 

Qy 5216 GAT AAAG AAC T AAAGAAAT T AAGAGATAGTCAAT TC T TGC C T TAT AC C TC AG TC TAT TC T 5275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II 
Db 53356 GAT AAAG AAC T AAAGAAAT T AAGAGATAGTCAAT TC T TGC C T TAT AC C TC AG TC TAT TC T 53297 

Qy 527 6 GT AAAAT T T T T AAAG AT AT AT GC AT AC C T GGAT TTCCTTGGCTTCTTT GAGAATGT AAGA 5335 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I M I I I I I I I I I I I I I I I I II I I M I I I II 
Db 53296 GT AAAAT TTTT AAAG AT AT ATGC AT ACCTGGATTTCCTTGGCTTCTTTGAGAATGT AAGA 53237 

Qy 5336 GAAATTAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACT 5395 

I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I M I I 
Db 53236 GAAATTAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACT 53177 

Qy 5396 GAGCATC TGC T TTTT GGAAGGCCC TGGGTTAGTAGTGGAGATGC TAAGGTAAGCCAGACT 5455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 53176 GAG CAT CTGCTTTTT GGAAGGC CC TGGG T TAG TAG T GGAGATGC TAAG GT AAGC C AGAC T 53117 

Qy 54 56 CATACCCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAG 5515 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 53116 CATACCCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAG 53057 

Qy 5516 ATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGA 5575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 53056 AT G T C C T C TAAAGAT GT AGGGAAAAG TGAGAGAGGGGT GAGGG T GTGG GGC T C C GGGT GA 52997 

Qy 5576 GAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTC 5635 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 52996 GAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTC 52937 

Qy 5636 C T T C T GG GGG AGC TG AT TG T AAT GAT C T T GGG TGGATC C 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 52936 CTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 52898 
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COMMENT 


AC153070 40359 bp DNA linear PRI 01-DEC-2004 

Homo sapiens chromosome X clone Qc-lSBl map q28, complete sequence. 
AC153070 

AC153070.1 GI:56158998 
HTG. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 
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Platzer,M., Michaelis,E. and Heinze,I. 
Chromosome X genomic sequence 
Unpublished 

2 (bases 1 to 40359) 
Lagemann,D. and Platzer,M. 
Direct Submission 

Submitted ( 01-DEC-2004 ) Genome Analysis, Institute of Molecular 
Biotechnology, Beutenbergstr . 11, Jena, Thuringia 07745, Germany 
Genome Center 

Center: Institute of Molecular Biotechnology 

Center code: 1MB 

Web site: http://genome.imb-jena.de/ 
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Contact : gsc j -submits genome . imb- j ena . de 

Project Information 

Center project name: X65 
Center clone name: Qc-15B1 

Summary Statistics 

Sequencing vector: M13mpl8; 100% of reads 
Chemistry: Dye- terminator Big Dye; 100% of reads 
Assembly program: Phrap; version 0.990329 
Consensus quality: 40359 bases at least Q40 
Consensus quality: 40359 bases at least Q30 
Consensus quality: 40359 bases at least Q20 
Quality coverage: 20.90x 


This sequence was finished as follows unless otherwise noted: all 
regions were double stranded, sequenced with an alternate 
chemistry, or covered by high quality data (i.e., phred quality >= 
30); an attempt was made to resolve all sequencing problems, such 
as compressions and repeats; all regions were covered by at least 
one plasmid subclone or more than one M13 subclone; and the 
assembly was confirmed by restriction digest. 


Neighboring sequence information: 

This clone is overlapped by CTC-233olO, QC-3H10, Qc-13B12, 


Sequence Quality Assessment:' 
This entry has been annotated with sequence quality 
estimates computed by the Phrap assembly program. 
All manually edited bases have been reduced to quality zero. 
Quality levels above 40 are expected to have less than 
1 error in 10, 000 bp. 

Base-by-base quality values are not generally visible from the 
GenBank flat file format but are available as part 
of this entry's ASN.l file. 


FEATURES 

source 


source 


source 


source 


Location/Qualifiers 
1. .40359 

/organism="Homo sapiens" 
/mol__type=" genomic DNA" 
/db_xref="taxon: 9 606" 
/ chr omo s ome = " X " 
/map="q28" 
/clone="Qc-15Bl" 
1. .39172 

/organism="Homo sapiens" 
/mol_type="genomic DNA" 
/db_xref="taxon: 9606" 
/clone="CTC-233ol0" 
/note="overlapping clone" 
13557. .40359 
/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref ="taxon: 9606" 
/clone="Qc-3H10" 
/note="overlapping clone" 
35451. .40359 
/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/clone="Qc-13B12" 
/note="overlapping clone" 
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Query Match 97.6%; Score 5535.8; DB 5; Length 40359; 

Best Local Similarity 99.3%; Pred. No. 0; 

Matches 5642; Conservative 0; Mismatches 27; Indels 10; Gaps 


8; 


Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 9070 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 9011 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I II I I I I I I 
Db 9010 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 8951 

Qy 121 C TC TC AAC C C AGGGAAGC C CAGGT GCC C AGAT GT GACGC C AC T GAC TT GAGC AT T AGT GG 180 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8 950 C TC TC AAC C C AGGGAAGC C CAGGT GC C C AGAT GT GAC GC C AC TGAC TT GAGC AT T AGT GG 88 91 

Qy 181 TT AGAGAGAAG C GAGG T T T T C GGT C T GAGGGGC GGC T T GAGATC GGTG GAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8890 TT AGAGAGAAGC GAGGT T T T C GGT C T GAGGGGC GGC T TGAGAT C GGTGGAGGGAAGC GGG 8831 

Qy 241 CCC A- GC TC TGTAAGGAGGCAAGGTGACAT GC TGAGGGAGGAC TGAGGACC CAC T TACC C 299 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 8830 CC C AGGC T C TG TAAGGAGGC AAGG TGAC ATGC TGAGGGAGGAC T GAGGACC C AC T T AC C C 8771 

Qy 300 CAGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTT 359 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8770 C AG AT AG AGGAC CC C AAAT AAT C C C T T C ATGC C AGT C C T G GACC AT CT GGTGGT GGAC T T 8711 

Qy 360 CTCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGA 419 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8710 CTCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCTGAAGTCAG 8651 

Qy 420 GCTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACA 47 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8 650 AGC TCGT GTGATCAGGGAAGGGCT GCT TAGGAGAGGGCAGCGTCCAGGC TC T GC C AG AC A 8591 

Qy 480 T CAT GCT C AGG AT T C T C AAGGAGG GC T G AGGG T C C C T AAG AC C C CAC T C C C G T GAC C C AA 539 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8590 TC AT GC T C AGG AT T C T C AAGGAGGGC TGAGGGT C CC TAAGAC C C CAC T C CC G T GAC C C AA 8531 

Qy 540 CCCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCC^CCCCC 599 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8530 CCCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCC 8471 

Qy 600 ACCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCC 659 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8470 ACCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCC 8411 

Qy 660 TCACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCC 719 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8410 TCACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCC 8351 

Qy 720 GCC AGGAAACATCCGGGTGCCCGGATGTGACGCCAC TGAC TTGCGCAT TGTGGGGC AGAG 779 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8350 GCCAGGAAACATCCGGGTGCCCGGATGTGACGCCAC TGAC TTGCGCAT TGTGGGGC AGAG 8291 

Qy 780 AGAAGC GAGGT T T CC AT TC TGAGGGAC GGC GT AGAG T T C GGC C GAAGGAACC TGAC C C AG 839 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8290 AGAAGC GAGGT T TCC ATT C TGAGGGACGGC GT AGAG T TCGGC C GAAGGAAC C T GAC C C AG 8231 
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Qy 840 GC T C TGT GAGG AGGC AAGG TGAGAGGC TGAGGGAGGAC T GAGGAC C C C GC C AC T C C AAAT 899 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8230 GC TC TGT GAGGAGGCAAGGTGAGAGGC TGAGGGAGGAC TGAGGACCCC GCCAC TCC AAAT 8171 

Qy 900 AGAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAG 959 

M I f I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I i I I I I I I 
Db 8170 AGAGAGC CC C AAAT AT T CC AGCGC C GC C C T T GC T GC C AGC C C TGGC C C AC C C GC GGGAAG 8111 

Qy 960 AC G TC T C AGC C TGGGC T GC C CC C AGAC C C C T GC TC C AAAAGC C T T GAGAGAC ACC AGGT T 1019 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 8110 ACGTCTCAGCC TGGGC TGCCCCCAGACCCCTGCTCCAAAAGCCTTGAG AGAC ACCACGTT 8051 

Qy 1020 CT T C T C C CC AAGC TC TGGAAT C AG AGGT T GC T GTGAC C AGGGC AGGAC TGGT T AGGAGAG 107 9 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 8050 C T T C T C C CC AAGC T C T GGAAT CAGAGGT T GC T GT GAC C AGGGC AGGAC T GGT T AGGAGAG 7991 

Qy 1080 GGCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCC 1139 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7990 GGCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCC 7931 

Qy 1140 CCCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAAC 1199 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 930 CCCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAAC 7871 

Qy 1200 CCCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCAC 1259 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7870 CCCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCAC 7811 

Qy 1260 CACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAA 1319 

I I I I I I I I I I I I M I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7810 CACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAA 7751 

Qy 1320 CCCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATC 137 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7750 CCCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATC 7691 

Qy 1380 CGGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGAC 1439 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I I I 
Db 7 690 CGGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGATGGCCCGATGTGAAACCACTGAC 7 631 

Qy 1440 T T GAAC C TC AC AGAT C T GAGAGAAGC C AGGT T CAT T T AAT GGTT C T GAGGGGCGGC T T GA 1499 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I M I I I I I I I I 
Db 7 630 T TGAAC C T C AC AGAT C T GAGAGAAGC C AGGT T CAT T T AAT GGT T C T GAGGGGC GGC T T GA 7571 

Qy 1500 GAT C C AC T GAG GGGAGTGG T T TTAGGC T C T GT GAGGAGGC AAGG T GAGAT GC T GAGGGAG 1559 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
Db 7570 GAT C C AC TGAGGGGAGT GG T T T T AGGC T C T GT GAGGAGGC AAGG T GAGAT GC T GAGGGAG 7511 

Qy 1560 GAC T GAGGAGGC AC AC ACC C C AGG T AGATGGC C C C AAAAT GATC C AGT ACC AC C C C TGC T 1619 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 7510 GAC T GAGGAGGC AC AC AC C C C AGG T AGATGGC CC C AAAAT GATC C AGT ACC AC C C C TGC T 7451 

Qy 1620 GCCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTC 167 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I I 
Db 7450 GC C AGC C C TGGAC C AC C C GGC C AGGAC AGAT G TC TC AGC T GGAC C AC CCCCCGTCCCGTC 7391 

Qy 1680 CC AC TGC CACTTAACCCAC AGGGC AATCTGTAGTCAT AGC TTATGTGACCGGGGCAGGGT 1739 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 7390 CC AC TGC C AC T TAAC CC AC AGGGC AATC TGT AGTC AT AGC T TAT GTGACCGGGGC AGGGT 7331 

Qy 1740 TGGTCAGGAGA-GGCAGGGCCCAGGCATCAAGGTCCA-GCATCCGCCCGGCATTAGGGTC 17 97 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 7330 TGGTCAGGAGAGGGCAGGGCCCAGGCATCAAGGTCCAGGCATCCGCCCGGCATTAGGGTC 7271 

Qy 17 98 AGGACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCC 1857 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7270 AGG AC C C TGGGAGGGAAC T GAGGG T TC C CC AC C C AC AC CT GTC T C C TC ATC T CC AC CGC C 7211 

Qy 1858 ACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTG 1917 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7210 ACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTG 7151 

Qy 1918 C TG T C AACC C AC GGAAGC C AC GGGAAT GGC GGC C AGGC AC T C GGATC T T GAC GT C C C CAT 1977 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7150 C TG T C AACC C AC GGAAGC C AC GGGAAT GGC GGC C AGGC AC T CGGATC T TGAC GT C C C CAT 7091 

Qy 1978 CC AGGG T C T GATGGAGGGAAGGGG C T T G AAC AGGGC C TC AGGGGAGC AGAGGGAGGGC C C 2037 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 7090 CCAGGG - CTGAT GGAGGGAAGGGGC T TGAAC AGGGC C TC AGGGGAGC AG AGGG AGGGC CC 7032 

Qy 2038 TAC TGCGAGAT GAGGGAGGCC TCAGAGGACCC AGC ACCC T AGGACACC GC AC CCC T GTC T 2097 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7031 TAC T GC GAGAT GAGGGAGGC C TC AGAGG AC C C AGC AC C C T AGGAC AC C GC AC CCCTGTCT 6972 

Qy 2098 GAG AC TG AGGC TGC C AC T T C TGGC C TC AAGAAT C AG AAC GAT GGGGAC TC AGAT T - GC AT 2156 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 6971 GAG AC T GAGGC TGC C AC T T T T GGC C T C AAGAAT C AG AATGAT GGGGAC T C AGAT T AGC AT 6912 

Qy 2157 GGGGG T GGGAC C C AGGC C T GC AAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC TC AG GGGA 2216 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6911 AGGGGTGGGAC CCAGGCC T GC AAGGC T TACGAGGAGGAAGAGGAGGGAGGAC TCAGGGGA 6852 

Qy 2217 CCTTGGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACA 227 6 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6851 CC T T GGAAT C C AGATC AGT GT GGAC C T C GGC C C T GAGAGG T C C AGGGC AC GG TGGC C AC A 67 92 

Qy 2277 TAT GGC C CAT AT T TC C TGC AT CT T T GAGGT GAC AGG AC AG AGC T GTGG T C T G AGAAGTGG 2336 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 67 91 T ATGGCC C AT AT TTCC TGC ATC TTTGAGGTGACAGGAC AG AGC TGTGGTCTG AGAAGTGG 6732 

Qy 2337 GGC C T C AGG T C AAC AGAGGGAGGAGT T C C AGGATC C ATAT GGCC C AAGAT GT GC CC CC T T 2396 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 6731 GGC C T CAGGT C AAC AGAGGGAGGAGT T C C AGGAT C C ATAT GGCC C AAGATGT GC C C CC T T 6672 

Qy 2397 CAT GAGGAC TGGGGAT ATC C C CGGC T C AGAAAGAAGGGAC T C C AC AC AGT C T GGC T GT C C 2456 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6671 CAT GAGGAC T GGGGAT AT C C C CGGC TC AGAAAGAAGGGAC T C C AC AC AGT C T GGC T GT C C 6612 

Qy 2457 CCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGT 2516 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6611 CCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGT 6552 

Qy 2517 ACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGAT 2576 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6551 ACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAA GGGAT 64 95 

Qy 2577 GTC TAC T CAT G TC AGGGAAT TGGGGGT T GAGGAAGC AC AGGC GC TGGC AGGAAT AAAGAT 2 636 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I 
Db 64 94 GT C TAC T CATG TC AGGGAAT T GGGGGT T GAGGAAGC AC AGGC GC T GGC AGGAAT AAAGAT 6435 

Qy 2637 GAG T GAGAC AG ACAAGGC TAT T GGAATC C AC ACC C C AGAAC C AAAGGGGTC AGC C C TGGA 2696 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 6434 GAG T GAGAC AG AC AAGGC T AT TGGAAT C C T C AC C C C AGAACC AAAGGGGC C AGC C C TGGA 6375 

Qy 2697 C AC C T C AC C C AGGATGTGGC T TCT T T T TC AC TCCTGTTTC C AGAT C TGGGGC AGGT GAGG 2756 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6374 C ACC TCACCCAGGATGTGGCTTC-TTTTC AC TCCTGTTTCC AGAT C TGGGGC AGGTGAGG 6316 

Qy 2757 ACCTCATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAG 2816 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6315 ACCTCATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAG 6256 

Qy 2817 AGCGGTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACC 287 6 

I I I I I 1 I I I I I I I I I I I I It I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I 
Db 6255 AGC GGT C C C AGGATC TGC C ATGCG T TC GGGTGAGGAAC AT GAGGGAGGAC TGAGGG T AC C 6196 

Qy 2877 C C AGGAC C AGAACAC T GAGGGAGAC TGC ACAGAAAT C AGC CCTGCCCC TGC T GT C AC C C C 2936 

I I E I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I 
Db 6195 C C AGGAC C AGAACAC T GAGGGAGAC TGC AC AGAAAT C AGC CCTGCCCC TGC T GT C AC C C C 6136 

Qy 2937 AGAGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTC 2996 

I I I I II I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I II 
Db 6135 AGAGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTC 607 6 

Qy 2 997 AGGGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCA 305 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6075 AGGGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCA 6016 

Qy 3057 GGC C C T G C C AG GAGT C AAGGT GAGGAC C AAGC GGGC AC C T C AC C C AGGAC AC AT T AAT TC 3116 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6015 GGC C C T G C C AG GAGT C AAGGT GAGGAC C AAGC GGGC AC C T C AC C C AGGAC AC AT T AAT TC 5956 

Qy 3117 CAATGAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGAT 317 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5955 C AAT GAAT T T T GAT AT CTCTTGCTGCCCTTCCC C AAGGAC C TAG GC AC GT GT GGC C AGAT 5896 

Qy 3177 GTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTC 3236 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5895 GTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTC 5836 

Qy 3237 TCAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTG 3296 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5835 T CAGAC C AGC AAAAGGGC AGGATC CAGGC C C T GC C AGGAAAAAT AT AAGGGC CCTGCGTG 5776 

Qy 3297 AGAAC AGAGGGGGTC AT C C AC T GC ATGAGAGT GGGG AT GT C AC AGAGT C C AGC C CACC C T 3356 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5775 AGAACAGAGGGGGTCATCC AC TGC ATGAGAGTGGGGATGTCAC AGAGT CCAGCCCACCCT 5716 

Qy 3357 CCTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGAT 3416 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5715 CCTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGAT 5656 

Qy 3417 TCCTCTTCC TGGAGC T C C AGGAAC C AGGC AGT GAGGC C T T GGT C T GAG AC AGT AT C C T C A 3476 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5655 TCCTCTTC C TG GAGC TC C AGGAAC CAGGC AGT GAGGC C T T GGTC TGAGAC AGT ATC C T C A 5596 

Qy 3477 GGTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACA 3536 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 5595 GGTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACA 5536 

Qy 3537 C C AAGGG C C CC AC C T GC C AC AGGAC AC AT AGGAC T C C AC AGAG TCT GGC C T C AC C T C C C T 3596 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5535 C CAAGGGCCCCACCTGCC AC AGGAC ACATAGGACTCCACAGAGTCTGGCCTC ACC TCCCT 547 6 
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Qy 3597 ACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACT 3656 

I I I I I I I I I I II I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5475 ACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACT 5416 

Qy 3657 TCCTCCTTCAGGTTTTCAGGGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCAC 3716 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 
Db 5415 TCC TCCT TC AGGTT T TCAGGGGAC AGGC CAAC CC AGAGGACAGGATTCCC TGGAGGCCAC 5356 

Qy 3717 AGAGGAGC AC C AAGG AGAAGATC T GTAAG T AGGC C T T T GT T AGAGTC T C C AAGGT T C AGT 3776 

I I II I II I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5355 AGAGGAGC AC C AAGG AGAAGATC T GTAAGT AGGC C T T TGT T AGAGTC TC C AAGGT T C AGT 5296 

Qy 3777 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 3836 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5295 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 5236 

Qy 3837 AGC TCC T GCC C AC AC TCCTGCCTGCTGCCCT GAC GAGAGT C ATC ATGT C TC T T GAGC AGA 3896 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5235 AGCTCCTGCCCACACTCCTGCCTGTTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGA 5176 

Qy 3897 GGAGTC T GC AC TGCAAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGGC C C T GGGC C TGG 3956 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 5175 GGAGTC T GC AC TGCAAGC C TGAGGAAGC C C T T GAGGC C C AAC AAGAGGCC C T GGGC C TGG 5116 

Qy 3957 TGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGG 4016 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5115 TGTGTGTGCAGGCTGCCGCCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGG 5056 

Qy 4017 TGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCA 4076 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5055 T GC C C AC T GC T GGGT C AAC AGAT C C T C C C C AGAGTC C TC AGGGAGC CTCCGCCTTT C CC A 4996 

Qy 4077 C T AC CAT CAAC T T C AC T C GAC AGAGGC AAC C C AGTG AGGG T TC C AGC AGC C G TGAAGAGG 4136 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4995 C T AC CAT CAAC T T C AC T CAAC AGAGGC AAC C C AGTG AGGG T T C C AGC AGC C G T GAAGAGG 4936 

Qy 4137 AGGGGCCAAGCACCTCTTGTATCCTGGAGTCCT TGT TCCGAGCAGTAATCACTAAG AAGG 4196 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4935 AGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGG 4876 

Qy 4197 TGGCTGATTTGGTTGGTTTTCTGC TCC TCAAAT ATC GAGC C AGGGAGC C AGT C AC AAAGG 4256 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 1 I I 
Db 4875 TGGCTGATTTGGTTGGTTTTCTGC TCC T CAAAT ATC GAGC CAGGGAGCCAGTCACAAAGG 4816 

Qy 4257 C AG AAAT GC TGGAGAGT GT C ATC AAAAAT T AC AAGC AC T G T T T T CC TGAGAT C T TC GGC A 4316 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4815 C AG AAAT GC T GGAGAGTGT CATC AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T TC GGCA 4756 

Qy 4317 AAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCG 4376 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 
Db 4755 AAGC C TC T GAG TCCT TGC AGC TGGT C T T TGGC AT T G AC GT GAAG GAAGC AGAC C CC AC C G 4696 

Qy 4377 GCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATA 4436 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 4 695 GCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATA 4636 

Qy 4 437 ATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGG 44 96 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 635 AT C AGAT C AT GC C C AAGAC AGGC T TC C T GAT AAT TG TC C T GGT C AT GAT T GC AATGGAGG 457 6 
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Qy 4497 GC GGCC AT GC T C C TGAGGAGGAAAT C T GGGAG GAGC TGAGT GTGATGG AGGT GTAT GATG 4556 

M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4575 GCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATG 4 516 

Qy 4557 GGAGGGAGC AC AGTGCCTATGGGGAGCC CAGGAAGC TGC TCACC CAAGATT TGGTGCAGG 4616 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4515 GGAGGGAGC AC AGTGC C T ATGGGGAGC C CAGGAAGC TGC T C ACC C AAGAT T T GGTGC AGG 4456 

Qy 4 617 AAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGT 4 675 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4455 AAAAGTACCTGGAGTACCGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGT 4396 

Qy 4676 GGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGG 4735 

I I I I I I I I I I I II E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 4395 GGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGG 4336 

Qy 4736 TCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTTGAGAGAGGAGG 4795 

I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4335 TCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTTGAGAGAGGAGG 4276 

Qy 4796 AAGAGGGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGC 4855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4275 AAGAGGGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGC 4216 

Qy 4856 ACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTC 4915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 4215 ACCTTCCAGGGCCGCGTGCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTC 4156 

Qy 4916 ACTCTGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGG 4975 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4155 ACTCTGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTGTTGGGTGACTTGG 4096 

Qy 4 97 6 AGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAA 5035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 4095 AGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAA 4036 

Qy 5036 TGAAC T T C AGC AT C C AAGT TTAT GAATGAC AGC AGT C AC AC AGT T C T G TGT ATAT AGT T T 5095 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 4035 TGAAC T T C AGC ATCC AAGT TTAT GAATGAC AGC AGT C AC AC AGT TCTGTGTATATAGT T T 397 6 

Qy 5096 AAGGGTAAGAG TCTTGTGTTT TAT T C AGAT T GGGAAAT C C AT T C TAT T T T GT GAAT T GGG 5155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3975 AAG GGTAAGAG TCTTGTGTTT TAT T C AGAT T GGGAAAT C C AT T C TAT T T TGT GAAT T GGG 3916 

Qy 5156 AT AAT AAC AGC AGT GGAAT AAGT AC T TAGAAAT GT GAAAAAT GAGC AG T AAAAT AG AT GA 5215 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 3915 AT AAT AAC AGC AG TGGAAT AAGTAC T TAGAAAT GTGAAAAAT GAGC AG T AAAAT AG ATGA 3856 

Qy 5216 GAT AAAGAAC TAAAGAAAT TAAGAGATAGTCAAT TC T TGC C TTAT ACC TCAGTC TATTC T 5275 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3855 GAT AAAGAAC TAAAGAAAT TAAGAGATAGTCAATTC T TGC C T TATACC TCAGTC TAT TC T 37 96 

Qy 5276 GT AAAAT T T T T AAAGAT AT AT GC AT AC C TGGAT TTCCTTGGCTTCTTT GAGAAT GT AAGA 5335 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 3795 GT AAAAT T T T T AAAGAT AT AT GC ATAC C TGGAT T T C C T TGGC T T C T T T GAGAAT GT AAGA 3736 

Qy 5336 GAAATTAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACT 5395 

I I II I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I E I I II I I I 
Db 3735 GAAATTAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACT 3676 

Qy 5396 GAGC AT C T GC T T T T T GGAAGGC CC TGGG T TAG T AGT GGAGAT GC T AAGGTAAGC C AGAC T 54 55 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 

Db 3675 GAGC ATC TGC T TT T T GGAAGGC C C TGGG T TAG TAGTGGAGAT GC TAAGGT AAGC C AGAC T 3616 

Qy 54 56 CATACCCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAG 5515 

I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I 
Db 3615 CATACCCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAG 3556 

Qy 5516 ATGTCC T C TAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGC T CCGGGTGA 5575 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3555 ATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCT CCGGGTGA 34 96 

Qy 5576 GAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTC 5635 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 34 95 GAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTC 34 36 

Qy 5636 C T T C TGGGGGAGC T GAT TGTAAT GAT C T TGGG T GGAT CC 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 34 35 CTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 3397 


RESULT 11 

AC116666/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 


REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 


AC116666 169351 bp DNA linear PRI 06-FEB-2003 

Homo sapiens chromosome X clone RP11-329E2 4 map q28, complete 
sequence . 

AC116666 AC024727 AF134576 
AC116666.2 GI: 282 614 68 
HTG . 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 

1 (bases 1 to 169351) 
Galgoczy,P., Wen,G. and Platzer,M. 
Chromosome X genomic sequence 
Unpublished 

2 (bases 1 to 169351) 
Platzer,M. 

Direct Submission 

Submitted ( 02-APR-2002 ) Genome Analysis, Institute of Molecular 
Biotechnology, Beutenberstr . 11, Jena, Thuringia 07745, Germany 

3 (bases 1 to 169351) 
Platzer,M. 

Direct Submission 

Submitted ( 06-FEB-2003 ) Genome Analysis, Institute of Molecular 
Biotechnology, Beutenbergstr . 11, Jena, Thuringia 07745, Germany 
On or before Feb 6, 2003 this sequence version replaced 
gi:13786263, gi:19881535. 

Genome Center 

Drafting Center: Washington Univ. Genome Sequencing Center 
Finishing Center: Insitute of Molecular Biotechnology 
Center code: 1MB 

Web site: http://genome.imb-jena.de/ 

Contact: gsc j -submits genome . imb- jena . de 
Project Information 

Center project name: X164 

Center clone name: RP11-329E24 
Summary Statistics 

Sequencing vector: M13, pUC18; 100% of reads 

Chemistry: Dye-terminator Big Dye; 100% of reads 
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Assembly program: Phrap; version 0.990329 
Consensus quality: 169243 bases at least Q40 
Consensus quality: 169295 bases at least Q30 
Consensus quality: 169351 bases at least Q20 
Quality coverage: 16.11x 


This sequence was finished as follows unless otherwise noted: all 
regions were double stranded, sequenced with an alternate 
chemistry, or covered by high quality data (i.e., phred quality >= 
30) ; an attempt was made to resolve all sequencing problems, such 
as compressions and repeats; all regions were covered by at least 
one plasmid subclone or more than one M13 subclone; and the 
assembly was confirmed by restriction digest. 

This clone was finished using overlapping sequence from accession 
AC009621 drafted by WIBR. 


Neighboring sequence information: 

This entry is overlapped by RP1-73F14, RP11-1007I13, RP11-157E12 
and covers Qc-3H5, ICRFXcl04-3G5, QC-16C3, Qc-4H4 entirely. 


Sequence Quality Assessment: 
This entry has been annotated with sequence quality 
estimates computed by the Phrap assembly program. 
All manually edited bases have been reduced to quality zero. 
Quality levels above 40 are expected to have less than 
1 error in 10,000 bp. 

Base-by-base quality values are not generally visible from the 
GenBank flat file format but are available as part 
of this entry's ASN.l file. 


FEATURES 

source 


source 


source 


source 


source 


Location/Qualifiers 
1. .169351 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref ="taxon: 9606" 
/ chr omo s ome= " X " 
/map="q2 8" 

/clone="RPll-329E24" 

/clone_lib="RPCI human BAC library 11" 
1. .33333 

/organism-"Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/clone="RPl-73F14" 

/clone_lib="RPCI human PAC library 1" 
1. .66680 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref ="taxon: 9606" 
/clone="RPll-1007I13" 

/clone_lib="RPCI human BAC library 11" 

20333. .169351 

/organism="Homo sapiens" 

/mol_type="genomic DNA" 

/db_xref ="taxon: 9606" 

/clone="AC009621" 

31813. .69584 

/organism="Homo sapiens" 

/mol_type="genomic DNA" 

/db xref="taxon:9606" 
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source 


source 


source 


variation 


variation 


variation 


variation 


variation 


variation 


variation 


variation 


variation 


variation 


variation 


variation 


/clone="Qc-3H5" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 

37604. .80648 

/organism="Homo sapiens" 

/mo l_type=" genomic DNA" 

/db_xref="taxon:9606" 

/clone="ICRFXcl04-3G5" 

/clone_lib="ICRF human X specific cosmid library" 

54954. .98328 

/organism="Homo sapiens" 

/mol_type="genomic DNA" 

/db_xref ="taxon: 9606" 

/clone="Qc-16C3" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 

81172. .97869 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref ="taxon: 9606" 

/clone="Qc-4H4" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 

132018. .169351 

/organism="Homo sapiens" 

/mo l_type=" genomic DNA" 

/db_xref="taxon: 9606" 

/clone="RPll-157E12" 

/clone_lib="RPCI human BAG library 11" 
2148 

/note="G substituted in clone: RP1-73F14" 

/replace="c" 

2251 

/note="C substituted in clone: RP1-73F14" 

/replace="t" 

2651 

/note="A substituted in clone: RP1-73F14" 

/replace="c" 

3309 

/note="deleted in clone: RP11-329E24" 

/replace=" " 

3677 

/note="G substituted in clone: RP1-73F14" 

/replace="t" 

5359 

/note="A substituted in clone: RP1-73F14" 

/replace="g" 

5484 

/note="T substituted in clone: RP1-73F14" 

/replace="a" 

6036 

/note="C substituted in clone: RP1-73F14" 

/replace="t" 

7127 

/note="C substituted in clone: RP1-73F14" 

/replace="g" 

7665 

/note="T substituted in clone: RP1-73F14" 

/replace="a" 

7978 

/note="A substituted in clone: RP1-73F14" 

/replace="t" 

7986 

/note="deleted in clone: RP11-329E24" 
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/replace=" " 
variation 7996 

/note="deleted in clone: RP11-329E24" 

/replace=" " 
variation 8223 

/note="C substituted in clone: RP1-73F14" 

/replace-"t" 
variation 8333 

/note="A substituted in clone: RP11-329E24 , A substituted 

in clone: RP11-1007I13" 

/replace="c" 
variation 8598 

/note="C substituted in clone: RP11-1007I13 , C 

substituted in clone: RP11-329E24" 

/replace="a" 
variation 8737 

/note="A substituted in clone: RP1-73F14" 

/replace="g" 
variation 8879 

/note="C substituted in clone: RP1-73F14" 

/replace="t" 
variation 8932 

/note="G substituted in clone: RP1-73F14" 

/replace="c" 
variation 9021 

/note="deleted in clone: RP1-73F14" 

/replace=" " 
variation 9351 

/note="T substituted in clone: RP1-73F14" 

/replace="c" 
variation 9356 

/note="C substituted in clone: RP1-73F14" 

/replace="g" 
variation 1014 6 

/note="deleted in clone: RP11-329E24" 

/replace=" " 
variation 10317 

/note="G substituted in clone: RP1-73F14" 

/replace="a" 

Query Match 48.7%; Score 2763.2; DB 5; Length 169351; 

Best Local Similarity 74.7%; Pred. No. 0; 

Matches 4348; Conservative 0; Mismatches 1118; Indels 354; Gaps 56; 


Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

II I I I I I I I I I I I II I II I I I I I I I I it II 

Db 53899 CCATGAGAACCCCCATCCTCCCCAGGCCCCACTACTCTCATCCCACCCCACCCCCACCCT 53840 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 53839 CATCTACCCTACCCTCACCCCCCTATCCCTACATTCTGGTAGAATCCGGTTTCGCCCCTG 53780 

Qy 121 C TC T C AAC C C AGGGAAG- C C C AG GT GC C C AGAT GT GAC GC C AC T GAC T T GAGC AT T AG TG 17 9 

II I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I 
Db 53779 CTTTCAACCGAGGGAATCCCCGGGTGCCCGGATGTGACACCACTGACTTG-GCGTTGGGG 53721 

Qy 180 GT T AGAGAGAAGC GAGGT T T T C GG TC T GAGGGGCGGC T TG AGAT C GGT GGAG GGAAGC GG 239 

II I I I I I I I I I I I III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 53720 GT C AAAG AGAAGC GAAG T T C T C GC T C TGAGTGGC GGC TT GAGAT T GGT GGAGGGAAGT GG 53661 

Qy 240 GCC CA- GC TC T GTAAGGAGGC AAGGT GAC AT GC TGAGGGAGGAC T GAGGAC C CAC T T AC C 298 
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I 1 1 1 1 1 1 1 i 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II III 

Db 53660 GTC CAGGC T C T GTGAAGAGGC AAGGTGAGAC T C TAAGGGAGGAC TC AGGAGGCC C C C ACC 53601 

Qy 2 99 CCAGATAGAGGACCC C AAATAATC C CTTCATGCCAGTCCTGGACCATCTGG 34 9 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 53600 CC AGAT AGAGGGCCC C AAATAATC C AGC AC T AC T C C T GC T GCC AGC CC TAAACC AC C T GG 53541 

Qy 350 TGGTGGACTTCTCAGGCTGGGCCACCCCCAGCCCCCT TGCTGCTTAAACCA 400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 53540 GGGCGGACTTCTCAGTCTGGGCCACTCCCTGCACCCTGCCAGCCCCTGTGGCTTAAGCCG 53481 

Qy 401 C T GGGGAC T C - GAAGT CAGAGC TC C GT G T GAT C AGGGAAGGGC T GC T T AGGAGAGGGC AG 4 59 

I I I I I I I I I I I I I I I I I I I I II I I I I II II I II I I I I I I I I I I I I I I I I I I 
Db 53480 C AAGGGAC TC T GGAGT CAGAGC T T C GT G TGAC CAAGGC AGGGC T GGT T AGGAGAGG GC AG 53421 

Qy 4 60 CGTCCAGGCTCTGCCAGACATCATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAG 519 

I M I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 

Db 53420 TGGCCAAGCTCTGCCAGGCATCAACATCAGGACCCTAAGTGAGGGCTGAGGGCCCCCAAC 53361 

Qy 520 ACCC CACTCCCGTGACCCAACCCCCACTCCAATGCTCACTCCCGTGACCCAACCCCC 576 

II I II II I I I I I I I I I I I I I I I I I III M INI 

Db 53360 CCCCATTCCCATCCCCCACCCCATCCCCATTTCCATCCCCATCCCCACCTCCATCCCCCA 53301 

Qy 577 TCTTCATTGTCATTCCAACCCCCACCCCACATCCCCCACCCCATCCCTCAACCCTGATGC 636 

I I I I I I I I I I I I I I I I I I I I I I I 

Db 53300 CCAGAACCCCTATCCCCCACCAGAAACCCTATCCTGCCCACTCCCCACCACGTTCATCCC 53241 

Qy 637 CCATCCGCCCA-GCCATTCCACCCTCACCCCCACCCCCACCCCCACGCCCACTCCCACCC 695 

III III II II Ml III I I I I I I I I I I I I I I I I I I I 
Db 53240 TACTCCCACCATTCCCATCTTCCCCACCCCTGACCCTCCTCCTCACCCTCCCACCCCCCC 53181 

Qy 696 C C AC C CAGGC AGGAT C C GG TTCCCGCCAGGAAACATCCGGGTGCCCG 742 

I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I 

Db 53180 ACACCCTGGCAGAATTCGGTTCTGCTCCTGCTTTCAACCCAGGGAATCCCTGGGTGACCA 53121 

Qy 743 GAT GT GAC GC C AC T GAC T T GC GCAT TGT GGGGC AGAGAGAAGC GAGGT T T C C AT T C T GAG 802 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 53120 GAT GT GGT GC C AC T G TC T T GC AC AT T T GAGGT C GGAGAGAAGC AAGGGC C T C GC TC T C AG 53061 

Qy 803 GGACGGC GT AGAGT T C GGC C GAAGGAAC C T GAC CC AGGC T C TGT GAGG AGGC AAGG TGAG 8 62 

II I 11 I III II II II II I III III I I I I I I I I I I I I I I I I I I I I I I I 

Db 53060 GGGC AGC - T GGAGATC AGC TGAGGGC AGC TGGC CC T GGC T C T GT GAGGAT GC AAGG T GAG 53002 

Qy 8 63 AGGC TGAGGGAGGAC T GAGGACCC C GC C AC T C C AAAT AGAGAGC C C C AAATAT T C C AG — 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 53001 AT GC T GAGGGAGGAC T AAGGAGT AT C C C AC C C C T GG T AGT GGAC C C C AAAT AAT C C AGTG 52942 

Qy 921 -CCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGACGTCTCAGCCTGGGCTGCC 97 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 52941 CC ACC TC TCCTGCTGCTAGCTCTGGACCATCCAGGGCAGGACTCCTT AGGC TGGGCC ACC 52882 

Qy 980 CCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTCTTCTCCCCAAGCTCTGGAA 1039 

I I I I I I I I I I I I I I I I III I I I I I I 

Db 52881 CCCAGTCCCCCACCGCTTAAGCCGCAGGGGA CTCAGGAG 52843 

Qy 1040 TCAGAGGTTGC TGT GAC C AGGGC AGGAC TGGT TAGGAGAGGGCAGGGCACAGGCTC TGCC 1099 

I I I I I III I I I I I I I I I I I I I I I I I I 1 II II I I I I I I III I I I I I I I I I I I I 
Db 52842 AC AGAGC TTGG TAT G ACC AGGGC AGGAC TGGT TAGGAGAGGAC AGC TCCC AGGC TC TGCC 52783 

Qy 1100 AGGC AT C AAGAT C AGC AC C C AAGAGGGAGGGC TGT GGGC C C C C AAGAC T GC AC TC C AATC 1159 

I I I I I I I I I I I I I I I I I I I I I I II 
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Db 52782 AGGAAAC AACGTCAGGAAC C TAAGGGAAAGC TGAGGC TAC CCC 52740 

Qy 1160 CCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACCCCCATCTCCTCAGCTACAC 1219 

I I I 

Db 52739 CAC 52737 

Qy 1220 CTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACCACCCTCCAGCCCCAGCACC 1279 

I I I I I I I I I I I I I I I II III I I I I I I I I II II 
Db 52736 GCCAAACTCTATTCCTGTCCCTACCTCCGTCCCCCACCTACACCCCCCATTCC CC 52 682 

Qy 1280 AGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAACCCCACCCTCATCTCTCTCA 1339 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 52681 CACCCCATCCCTACCGGCACCTCTATCCCACATCCCCCA 52 64 3 

Qy 1340 TGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCCGGTT-TGCCCCTGCTCTCA 1398 

I I I I II I I I I I I I I I I I I I II I I I I I I I I I III 
Db 52 642 CCCCTATCCTGGCAGAATCCGATTCTGCCCCTGATTTCA 52 604 

Qy 1399 AC C C AGG GAAGC C C T GGTAGGC C C GATG TGAAACC AC T GAC T T GAAC C T C AC AGAT C T GA 1458 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I 

Db 52603 ACCCAGGGAAGCCCTAGGGGGCCGGATGTGATGCTGCTGACTTGTGCATTGCGGGTCAGA 52544 

Qy 1459 GAGAAGC C AGG T TC AT T TAAT GG T TC T GAGGGGCGGC T T GAGAT C CAC TGAG GGGAGT GG 1518 

M II I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 52543 GAGAATCAAGG GCATGGTTCT GAGAAGC C GAC TGAGATCAGCAGAGGGGAATGG 52490 

Qy 1519 TT T T AGGC T C T GT GAGGAGGC AAGGT GAGA- TGC T G AGGGAGGAC TGAGGAGGC AC AC AC 1577 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I Ml 
Db 52489 GC C C GGGC T C T GT GAGGAGGC AAGGT GAGAC C C C C GAGGAAGGAAT GAGGAAGC C C T CAC 52430 

Qy 1578 CC C AGG T AGAT GGC C C C AAAAT GATC C AG TAC CACC C C T GC T GC C AGC C C T GGAC C AC C C 1637 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 52429 CCA — GAT AGAGAAC C C C AAAT AATC C AG TAC TAC C T T T GC TGC C AGC C C T GGAC CAC — 52374 

Qy 1638 GGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCCCACTGCCACTTAACCCA 1697 

I I I I I I I I I I I I I I I I I III III I I I I I I I I I I I I I I I I I I 
Db 52373 — CCAGGGCAGAC T TC TCAGGC T GGAC C T TC C C CCCTCCCCACTGCCACTTAAGCCA 52319 

Qy 1698 CAGGGCAATCTGTAGTCATAGCTT-ATGTGACCGGGGCAGGGTTGGTCAGGAGAGGCAGG 17 56 

II II I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I 
Db 52318 C AAGGGAC TC T GGAG T C AGAC C T T GGT G T GAC C AGGGAAGGGC C GGT C AGGAGAGG 52263 

Qy 1757 GCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGGACCCTGGGAGGGAACT 1816 

II II I I I I II I I I I I I I I I I I I I I I I I II Ml Ml I 
Db 52262 GCAGGGGCCAGGCTCTGTCAGGCATCAAAATCAGGACCCTGAGAGAGAATT 52212 

Qy 1817 GAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACCCCACTCACATTCCCAT 1876 

I I I I I III I I I I II II I I I I I I I I I I I I III I 

Db 52211 GAGGGCCCCCACCCCAACCCCTATACCCATCCCTAACCCCATACCCACTCTACTTGCATT 52152 

Qy 1877 ACCTACCCCCTACC CCCAACCTCATCTTGTCAGAA TCCCTGCTGTC 1922 

II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 52151 CCCAGCCCCATCCCCACACCCTACCCCATCTTGGCAGAATCTGTTTCTTTCCCTGCAGTC 52092 

Qy 1923 AAC C CAC GGAAGC CAC GGGAAT GG C GGC C AGG CAC T C GGATC T T GACG T CCC CAT C CAGG 1982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I II I I I I I I I I 
Db 52091 AAC C C AC AGAAGC C C C AGGAAT GAC AGAC AGGC AC ACC CAT TC T GAC G TC C AC ATC CAGG 52032 

Qy 1983 GTCTGATGGAGGGAAGGGGCT TGAAC AGGGCC TC AGGGGAGC AGAGGGAGG — 2033 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 52031 GCTGAAGGAGGGAAAGGGCTTAGTATCATGAGCAGGGCCTCAGGGGAGTCTCTGCTCCTC 51972 
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Qy 2034 - - GCC C T AC TGCGAGATGAGGGAGGCC TCAGAGGACCCAGCACCC TAGGA C 2082 

I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 51971 AAGCCCTGCTGGGAGTAAAGGGAGGCCTCAGGGAACCCAGGTCCTCAGGATAGGGGGTCC 51912 

Qy 2083 AC C GC AC CCCTGTCT GAGACTGAG — GC TGC C AC TTCTGGCCT C AAG AATC AGAAC GAT G 2140 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 51911 AC T C C AAC C C T GT C T GAGACTGAGGCGC CTCCTCTT TC ATC C TC GGGAATC AGAGGGAT G 51852 

Qy 2141 GGGAC TCAGAT TGCATGGGGGTGGGACCCAGGCCTGCAAGGCTTACGCGGAGGAAGAGGA 2200 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 51851 GAGAC TC ACGTCAGC AGAGGGTGGGGCCCAAC CC TGCCAGGATC AAGGAGAGGAAGAAGA 51792 

Qy 2201 GGGAGGAC T C AGGGGAC C T TGGAAT C C AGATC AGT G TGGAC C TC GGCC C TGAGAGG T C C A 2260 

I I I I I I I I I I I I II I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I 
Db 51791 GGGAGGAC TC AGGGT AC C T T T GAG T C C AGAAC AAT GGGGAC C T T T GCC C TGGGAGG T C C A 51732 

Qy 2261 GGGCACGGTGGCCACATATGGCCCATATTTCCTGCATCTTTGAGGTGAC AGGACAG 2316 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 51731 GTGCACAGTGGCCACCTGTAGCCCATGCTTGCTGCACCTTCTGGGTGACAAAGAGGAGAG 51672 

Qy 2317 AGCTGTGGTCTGAGAAGTGGGGCCTCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATAT 2376 

I I I I I I I I I III I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I III I 
Db 51671 GGCTGTGGTCAGAGCAGTGGTGACTCAGGTCAGCAGAGGGAGGAGTCCCAGCATCTGCAG 51612 

Qy 2377 GGC C C AAGATG T GCC C C C T TC ATGAGGAC T GGGGAT AT C C C C GGC TC AGAAAGAAGGGAC 2436 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 51611 GC C CC AAT GTG T GCC C CAT TC ATGAAGAT T GGGGAT A- C C T T GGC TC AGAAAGAAGGGAC 51553 

Qy 2437 TCCACACAGTCTGGCTGTCCCCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGG 2496 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 51552 CCCACAGAGTCTGGCTGTCCCCTGATTTTTGCTCAGAGGGGACCAAATCAAGGATAGCCC 51493 

Qy 2497 T AT GT T C CAT T C T C AC T T G T AC C AC AGGC AGGAAGT T GGGGGGC C C T C AGGGAGAT GGGG 2556 

I I I I I III I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 51492 TAT GT GC C AAC C T CAT T T G TGC C AC AGGAAAGAAGT T GAAGAGC C C T C AGGGT GAT GGGG 51433 

Qy 2557 TCTTGGGGTAAAGGGGGGATGTCTACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAG 2616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III 
Db 51432 TCTTGCAGTAAAGGGGAGCTATCTGCTCATCTCAGGGGGTTTCAGGTTGAGGAATGGCAG 51373 

Qy 2 617 GC GC T GGC AGGAATAAAGATGAGT GAGAC AGACAAGGC TAT T GGAAT C C AC AC C C C AGAA 2 676 

III III I I I I I I I I III I I I I I I I I I I I I I I I I I I I I 

Db 51372 GCCCCATCACG ATGAAGAGT AACC CACAGGAGGCC ATAGAAACACTCAC CCC AGAA 51317 

Qy 2677 CCAAAGGGGTCAGCCCTGGACACCTCA CCCAGGATGTGGCTTCTTTTTCAC 2727 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 51316 CCAAAGGGGTCATACCTGGACACCCCATGTGGGGGTGACAGGATGTAGC-TCCATCTCAT 51258 

Qy 2728 TCCTGTTTCCAGATCTGGGGCAGGTGAGGACCTCATTCTCAGAGGGTGACTCAGGTCAAC 2787 

I I I I I I I I I I I I I I I III I I I I I I I I I II I I I I I II I I I I I I I I I II I I I I I 
Db 51257 TCCTGTTT TCAGAT C TC GG GGAGG T GAGGAAC TTGTTCTCC GAGGATG AC T C AGGT CAAC 51198 

Qy 2788 GTAGGGACCCCCATCTGGTCTAAAGACAGAGCGGTCCCAGGATCTGCCATGCGTTCGGGT 2847 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III 
Db 51197 ACAGGGGCCCCCATCTGGTGGATAGACAGAGTGGTCCCAGGATCTGTCAGTAGTTCCGGT 51138 

Qy 2848 GAGGAAC ATGAGGGAGGAC TGAGGGTAC CCCAGGAC C AGAACAC TGAGGGAGAC TGCACA 2907 

I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I I I I II I III III 
Db 51137 GAGGAAC ATGAGGGAC GAT T GAGGGC AC CC T T GGGC C AGAAC AC AGAT GAGGAC C T C AC G 51078 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 


2908 GAAATCAGCCCTGCCCCTGCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAGGT 2967 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
51077 GAAATCTGCCCTGCCCCTGCTGTCACTCCAGAGAGCATGGGCAGGGCTGTCTGCTGCAGT 51018 

2968 CCTTCCG — T T ATC C T GGGATC AT TG AT GT C AGG GACG GGGAGGCC T T GGT C TGAGAAG G 3025 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

51017 CCCCCCGACTTACCCTGGGATCATTGGTGTCAGGGATGGGGAGGTCTTTGTC-GAGGGGT 50959 

3026 C T G C GC T C AGG TC AG T AGAGGGAGC GTC C C AG GC C C TGCC AGGAGT C AAGGT GAGG AC C A 3085 
I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 
50958 C T GC AC T C AGG T C AG T AGAGGGAGC GT C T T AGGC CC TGC CAGGAGAC AAGGT AAGAAC GA 50899 

3086 AGC GGGC AC C T C AC C C AGG AC AC AT T AAT T C C AAT GAAT T T TGATATC TCTTGCTGCCCT 3145 

III II I I I I I I I I II I I I I I I I MINIUM I I I I I I I I I I I III III 
50898 AGCAGGTTCCTCACCCAGGACACATGAATTCCAATGCATTTCAGCATCTCTTCCTGTCCT 5083 9 

314 6 TCCCCA-AGGACCTAGGCACGTGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCT 3204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III MM II I I I I I I I I 

50838 TCCCAAGAGGACCTGGGCACGTGTGGCCAGATGTGAGTCTCCTCATGTCCT GTTCCC 50782 

3205 TAT CATGGATG TGAAC TC T TGAT T TGGAT T TC TCAGACCAGCAAAAGGGCAGGATC CAGG 32 64 

II I I I I I I I I II I I I I I I IE II I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
50781 TAT C AGGGAT G TGAG C TC T TAATC TGAG T T T C TCAGGC C AGC AAAAGG GTGGGAT C CAGG 50722 

3265 CCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCCACTGCATGA 3324 

I I I I II I I I I I I I I I I II I I II I II I I I I II I II I I I ' I I I II I I I I I 
50721 C C T T GC C AGGAGAAAGGT GAGGGC C C T G T GT GAGC AC AGAGGGGACC AT TC AC C C C AAGA 50662 

3325 GAG TGGG GAT G T C AC AGAG TC C AGCC C AC C C T C C T GGT AGC AC T GAGAAGC C AGGGC T GT 3384 
I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I 
50661 GGG T GGAGAC C TC AC AGAT TC C AG C C TAC CCTCCTGT T AGC AC T GGGGGC C T GAGGC TG T 50602 

3385 GCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCAGGAACCAGG 34 44 

I I I I I I I I I I I II II I I M II II I I II I I I I I I I I I I I I I II I I I I I I I I I III 

50601 GC T T GC AG T C T GC AC C C TGAGGGC C CAT GC AT TCCTCTTC C AGGAGC T CC AGGAAAC AGA 5054 2 

3445 CAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTCACAGAGCAGAGGATGCACAG 3500 

II I I I I II II I I II I I I I I I II I I I I I I I I I II I I II I I I II I I II I 

50541 CAC TGAGGCCT TGGTCTGAGGCCGTGCCC TCAGGTCACAGAGCAGAGGAGATGCAGACGT 50482 

3501 GGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAGGA 3560 

I II I I I I I I I I I II I I I I I I I I I II I I I I II I II II I I I I Ml Ml I 

50481 CTAGTGCCAGCAGTGAACGTTTGCCTTGAATGCACACTAATGGCCCCCATCGCCCCAGAA 50422 

3561 C AC AT AGGAC T C CAC AGAG T C T GGC C T C A- C C T C C C TAC T GT C AGTC C TGT AGAAT C GAC 3619 
II II I I I I I II I II II II I I II I I I II I I I II I I II I I II I I I I I I I I I 
50421 C AT ATGGGACT CC AG AGC ACC TGGCCTCACCCTCTC TACT GTC AGTCC TGC AGAAT C AGC 50362 

3620 CTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAGGGGA 3679 

I I I I I I I I I I II I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I 
50361 CTCTGCTTGCTTGTGTACCCTGAGGTGCCCTCTCACTTTTTCCTTCAGGTTCTCAGGGGA 50302 

3680 C AGGC C AAC C C AG AGGAC AGGAT TCCC TGGAGGCC ACAGAGGAGCAC 3726 

II I I I III II II I I I II I II I I I I I II I I I I I I I I I I 
50301 C AGGC T GAC C AGGAT C AC C AGGAAGC T C C AGAGGAT CC C C AGGAGGC C C TAG AGGAGC AC 5024 2 

3727 C-AAGGAGAAGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTG 3785 

I I I I I I II I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I II I II I I I I I I I 
50241 CAAAGGAGAAGATCTGTAAGTAAGCCTTTGTTAGAGCCTCCAAGGTTCAGTTTTTAGCTG 50182 

3786 AGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGC 3845 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

50181 AGGCTTCTCACATGCTCCCTCTCTCTCCAGGCCAGTGGGTCTCCATTGCCCAGCTCCTGC 50122 

384 6 CCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGC 3905 

I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I II 
50121 CCACACTCCTGCCTGTTGCGGTGACCAGAGTCGTCATGTCTCTTGAGCAGAAGAGTCAGC 50062 

3906 ACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGC 3965 

I I I I I I I I I I I I I I I I I I MINI II I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
50061 AC T GC AAGC C T GAGGAAGGC CT TGAC AC C C AAGAAGAGGC C C T G GGC C T GGT GGGT GTGC 50002 

3966 AGGCTGCCAC CTCCTCCTCCTCTCCTCTGGTCCTGGGCA 4004 

II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
50001 AGGCTGCCACTACTGAGGAGCAGGAGGCTGTGTCCTCCTCCTCTCCTCTGGTCCCAGGCA 4 9942 

4005 CC C T GGAGGAGG TGC C C AC T GC T GGGT C AAC AGAT C C TC C C C AGAGTC C T CAGGGAGCC T 4064 
I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I II I I I I I I I I I I I I 
4 9941 CCCTGGGGGAGGTGCCTGCTGCTGGGTCACCAGGTCCTCTCAAGAGTCCTCAGGGAGCCT 4 988 2 

4065 CCGCCTTTC C C AC T ACC AT CAAC T TC AC TCGAC AGAGGC AAC C C AGT GAGGG T T C C AGC A 4124 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I 
4 9881 CCGCCATCCCCACTGCCATCGATTTCACTCTATGGAGGCAATCCATTAAGGGCTCCAGCA 4 9822 

4125 GCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAA 4184 
II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
4 9821 ACC AAGAAGAGGAGGGGC C AAGC AC C TC C C C T GAC C C AGAGTC TGTGTTCC G AGC AGC AC 49762 

4185 TCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGC 4244 

III I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I III II II I I I I I 
49761 TC AGT AAGAAGGT GGC T GAC T TGAT TC AT T T T C T GC T C C T C AAG TAT T AAGT C AAGGAGC 49702 

4245 CAGTCACAAAGGCAGAAATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTG 4 304 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I 
49701 CGG TC AC AAAGGC AG AAAT GC T GGAGAGAG T C ATC AAAAAT T AC AAGC GCTGCTTTCCTG 49642 

4305 AGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAG 4364 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 9641 TGATCTTCGGCAAAGCCTCCGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAG 49582 

4365 CAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCC 4424 

I I I I I I I I I I II II I I I I I I I I M I I I II I I I I II I I I I I I I I I I I I I I 

4 9581 CGGAC CC C AC C AGC AAC AC C TAC AC C C T T GTC AC C T GC C T GGG — ACTCCTATGATGGCC 4 9524 

4425 TGCTGGGTG ATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCA 4 481 

II III II I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I III III II 

4 9523 TGG TGGT T GAT AATAATC AGAT CAT GCC C AAGACGG GC C T CC T GAT AAT C GT C T T GGGCA 4 94 64 

4482 TGAT T GC AATGGAGGGC GGC C ATGC TC C T GAGGAGGAAAT C TGGGAGGAGC T GAGT G T GA 4541 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
49463 TGAT T GC AAT GGAGGGC AAATGC G T CC C T GAGGAGAAAAT C T GGGAGG AGC T GAGT GT GA 49404 

4542 TGGAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCC 4 601 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I I I 

4 9403 TGAAGGTGTATGTTGGGAGGGAGCACAGTGTCTGTGGGGAGCCCAGGAAGCTGCTCACCC 4 934 4 

4602 AAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCAC 4 660 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I 
49343 AAGATTTGGTGCAGGAAAACTACCTGGAGTACCGGCAGGTGCCCAGCAGTGATCCCATAT 49284 

4661 GCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTG 4720 
I I I I I I I I I I II II I I I I I I I I I I I I I II I I I I I I I I I I I I II I 
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Db 4 9283 GCTATGAGTTACTGTGGGGTCCAAGGGCACTCGCTG C T TGAAAGT AC TGG 49234 

Qy 4721 AGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAG 4780 

II I III III I I I I I I I I I I I I I II I I III II I I I I I I I I I I I I I I I I I I I 

Db 49233 AGCACGTGGTCAGGGTCAATGCAAGAGTTCTCATTTCCTACCCATCCCTGCATGAAGCAG 49174 

Qy 4781 C T T TGAGAGAGGAGGAAGAGGGAGTC TGAGCATGAGTTGC AGCC AAGGCC AGTGGGAGGG 4840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 49173 C T T TGAGAGAGGAGGAAGAGGGAGTCTGAGCATGAGCTGC AGCC AGGGCCAC TGCGAGGG 49114 

Qy 4841 GGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCC-TCGTGTGAC 4899 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I 1 I II I I I I I I I I I I I II I I I I 

Db 4 9113 GGGCTGGGCCAGTGCACCTTCCAGGGCTCCGTCCACTAGTTTCCCCTGCCTTAATGTGAC 4 9054 

Qy 4900 AT GAGGC CC AT TC TT CAC T C — TGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTG 4957 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 4 9053 ATGAGGCCCATTCTTCTCTCTTTGAAGAGAGCAGTCAACATTCTTAGTAGTGGGTTTCTG 48994 

Qy 4958 TTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTT 5017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48993 TTCTATTGGATGACTTTGAGATTTGTCTTTGTTTCCTTTTGGAATTGTTCAAATGTTCC- 48935 

Qy 5018 T T T T AAG GGAT GGT T GAAT GAAC T T C AGCATC C AAG T T TAT GAAT GAC AGC AGT C AC AC - 5076 

I I I I I I IE I I I I II I I I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 
Db 48934 T T T TAAT GGGT GGTTGAAT GAAC T TCAGCATT CAAATTTATGAATGAC AGTAGTC ACACA 48875 

Qy 5077 -AGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCC 5135 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 8874 TAG TGC T GT T TAT AT AGT T TAGGAGTAAGAGT C TTGTTTTT TAT TC AG AT T GGGAAAT C C 48815 

Qy 5136 ATTCTATTTTGTGAATTGGG — ATAAT AACAGCAGTGGAATAAGTAC TTA- GAAATGTGA 5192 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 
Db 4 8814 AT T C CAT T T T G TGAAT TGGGAC AT AGT T AC AG C AGT GGAAT AAG TAT T CAT T TAGAAATG 48755 

Qy 5193 AAAAT GAGC AG T AAAAT AG ATGAGAT AAAGAAC TAAAGAAAT T AAGAGATAG T C AAT T C T 5252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 48754 T GAAT GAGC AG T AAAAC TGAT GAC A TAAAGAAAT T AAAAGAT AT T TAAT T C T 48703 

Qy 5253 TGCCTTATACC TCAGTCTATTCTGTAAAA — T T T T T AAAG AT AT AT GC AT AC C T GG AT T T 5310 

I I I I I I I I I I I I I II I I I II I I I I I I Mill II I II I I I I I II I I I I I I I I 
Db 48702 TGC CT TATA- CTCAGTCTACTCGGTAAAATTTTTTTTAAAAAATGTGCATACCTGGATTT 48644 

Qy 5311 CCTTGGCTTCTTTGAGAATGTAAGAGAAATTAAATC TGAAT AAAGAATTCTTCCTGTTCA 5370 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 8 643 CCTTGGCTTCTTTGAGAATGTAAGACAAATTAAATCTGAATAAATCATTCTCCCTGTTCA 48584 

Qy 5371 CTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCTGGGTTAGTAG 5430 

I I I I I I I ill I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I III 
Db 4 8583 CTGGCTCATTTATTCTCTATGCACTGAGCATTTGCTCTGTGGAAGGCCCTGGGTTAATAG 48524 

Qy 5431 TGGAGATGCTAAGGTAAGCCAGAC TCATACCC ACCCATAGGGTCGTAGAGTC TAGGAGCT 54 90 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I I I I I 
Db 4 8523 TGG AGAT GC T AAGGT AAGC C AGAC T CAC C C C T AC C CAC AGGGT AGT AAAG T C TAGGAGC A 48464 

Qy 5491 GCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGG 5550 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I I I I I I I I I 

Db 4 84 63 GCAGTCATATAATTAAGGTGGAGAGGTGCCCTCTAAGATGTAGAGAAAAAGTAAGAAAGG 48404 

Qy 5551 GGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCAT 5610 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III II II I I I I II I 

Db 48403 GGTGAGGGTGTGGGGCTCCAGGTGAGAGTGGTCCAGAGGTAAATGCCCTGTGTGGGGCCT 48344 
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Qy 5611 TTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGG 5670 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I II 

Db 48343 TTTGGACTTTGGGAAACTGCAGTTTCTTCGGAGGGAGCTGATTCTAATGAATCGGCGGGG 48284 
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AF274856 173962 bp DNA linear PRI 31-DEC-2002 

Homo sapiens chromosome X clone RP11-1007I13 map q28, complete 
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AF274856 AC091482 

AF274856.3 GI:27436769 

HTG. 

Homo sapiens (human) 
Homo sapiens 
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Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae ; Homo . 
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Unpublished 
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Platzer,M. 
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Contact: gscj-submit@genome.imb-jena.de 
Project Information 

Center project name: xll9+ 

Center clone name: RP11-1007I13 
Summary Statistics 

Sequencing vector: M13, pUC18; 100% of reads 

Chemistry: Dye-terminator Big Dye; 100% of reads 

Assembly program: Phrap; version 0.990329 

Consensus quality: 173760 bases at least Q40 

Consensus quality: 173893 bases at least Q30 

Consensus quality: 173962 bases at least Q20 

Quality coverage: 18 . 37x 


This sequence was finished as follows unless otherwise noted: all 
regions were double stranded, sequenced with an alternate 
chemistry, or covered by high quality data (i.e., phred quality >= 
30); an attempt was made to resolve all sequencing problems, such 
as compressions and repeats; all regions were covered by at least 
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one plasmid subclone or more than one M13 subclone; and the 
assembly was confirmed by restriction digest. 


Neighboring sequence information: 

This clone is overlapped by RP11-366F6, QC-7G11, RP1-77B24, 
ICRFXcl04-E0681, QC-11C8, RP11-329E24, RP11-173J18, QC-3H5, QC-3G5, 
QC-16C3 and covers QC-9A9, RP1-73F14 entirely. 


Sequence Quality Assessment: 
This entry has been annotated with sequence quality 
estimates computed by the Phrap assembly program. 
All manually edited bases have been reduced to quality -zero . 
Quality levels above 40 are expected to have less than 
1 error in 10, 000 bp. 

Base-by-base quality values are not generally visible from the 
GenBank flat file format but are available as part 
of this entry's ASN.l file. 


FEATURES 

source 


source 


source 


source 


source 


source 


Location/Qualifiers 
1. .173962 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref ="taxon: 9606" 
/chromosome="X" 
/map="q2 8" 

/clone="RPll-1007I13" 
1. .19170 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref ="taxon: 9606" 
/clone="Qc-7Gll" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 
/note-"overlapping clone" 
1. .29165 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref ="taxon: 9606" 
/clone="ICRFXcl04-E0681" 

/clone_lib="ICRF human X specific cosmid library no. 104" 
/note="overlapping clone" 
1. .39874 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref ="taxon: 9606" 
/clone="Qc-HC8" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 
/note="overlapping clone" 
1. .45885 

/organism="Homo sapiens" 
/mol_type="genomic DNA" 
/db__xref="taxon:9606" 
/clone="RPll-366F6" 
/clone_lib="RPCI human BAC 11" 
/note="overlapping clone" 
1. .69889 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9606" 
/clone-"RPl-77B24" 
/clone_lib="RPCI human PAC 1" 
/note="overlapping clone" 
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source 27601. .63308 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9606" 
/clone="Qc-9A9" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 
source 55599. .140615 

/organism="Homo sapiens" 

/mol_type="genomic DNA" 

/db_xref="taxon:9606" 

/clone="RPl-73F14" 

/clone_lib="RPCI human PAC 1" 
source 107283. .173962 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref="taxon: 9606" 

/clone="RPll-329E24" 

/clone_lib="RPCI human BAC 11" 

/note="overlapping clone" 
source 127615. .173962 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref="taxon:9606" 

/clone="RPll-173J18" 

/clone_lib="RPCI human BAC 11" 

/note="overlapping clone" 
source 139095. .173962 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref="taxon:9606" 

/clone="Qc-3H5" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 
/note="overlapping clone" 
source 144886. .173962 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/clone="Qc-3G5" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 
/note="overlapping clone" 
source 162236. .162656 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/clone="Qc-16C3" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 

/note="overlapping clone, partially deleted" 
variation 278 ' 

/note="C substituted in clone: RP11-366F6" 

/replace="t" 
variation 1602 

/note="T substituted in clone: RP11-366F6 , T substituted 

in clone: RP11-1007I13" 

/replace="g" 
variation 1971 

/note="C substituted in clone: RP11-1007I13 , C 

substituted in clone: RP11-366F6" 

/replace="t" 
variation 2000 

/note="C substituted in clone: ICRFXcl04-E0681 " 

/replace="t" 
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variation 2118 

/note="T substituted in clone: Qc-7G11 , T substituted in 

clone: RP1-77B24" 

/replace="a" 
variation 2554 

/note="T substituted in clone: QC-11C8 , T substituted in 

clone: RP1-77B24 , T substituted in clone: Qc-7G11" 

/replace="c" 
variation 2670 

/note="G substituted in clone: ICRFXcl04-E0681 " 

/replace="a" 
variation 3178 

/note="G substituted in clone: RP11-366F6 , G substituted 

in clone: RP11-1007I13" 

/replace="a" 
variation 3359 

/note= M T substituted in clone: Qc-7G11 , T substituted in 

clone: QC-11C8 , T substituted in clone: RP1-77B24"' 

/replace="c" 
variation 3670. .3674 

/note="deleted in clone: RP11-1007I13 , deleted in clone: 

RP11-366F6" 

/replace=" " 
variation 3851 

/note="T substituted in clone: RP1-77B24 , T substituted 


Query Match 48.7%; Score 2763.2/ DB 5; Length 173962; 

Best Local Similarity 74.7%; Pred. No. 0; 

Matches 434 8; Conservative 0; Mismatches 1118; Indels 354; Gaps 


56; 


Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

II I I I I I I Mill II I II MINIM M II 

Db 161181 CCATGAGAACCCCCATCCTCCCCAGGCCCCACTACTCTCATCCCACCCCACCCCCACCCT 161122 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 161121 CATCTACCCTACCCTCACCCCCCTATCCCTACATTCTGGTAGAATCCGGTTTCGCCCCTG 161062 

Qy 121 C TC TC AAC C C AGGGAAG - CC CAGG T GC C C AGAT GT GAC GC C AC TGAC T TGAGC AT T AGT G 17 9 

II I I I I I I M I I I I III M I I I I I I I I I I I IE I i I I I I I I I I I I I II I I 

Db 161061 CTTTCAACCGAGGGAATCCCCGGGTGCCCGGATGTGACACCACTGACTTG-GCGTTGGGG 161003 

Qy 180 GT T AGAG AGAAGC GAGGTT T T C GG T C TG AGGG GC GG C T T G AGAT C GGT GGAGGGAAGC GG 239 

II I I I I I I I I I M III Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 161002 G T C AAAGAGAAGCGAAG TTCTCGCTCT G AGTGGC GGC T T G AGAT T GGT GGAGGGAAGT GG 160943 


Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


240 GC C C A- GC T C T G T AAGGAGGC AAGGTGAC ATGC T G AGGGAGGAC T GAGGACC C AC T T AC C 298 
I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I II III 
160942 GTC C AGGC T C T GTGAAGAGGC AAGG T GAGAC T C T AAGGGAGGAC TCAGGAGGC C C C C AC C 160883 


299 


349 


C C AGAT AGAGG AC C C C AAAT AAT C C CTTCATGCCAGTCCTGGACCATCTGG 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

160882 C C AGAT AGAGGGCC C C AAAT AAT C C AGC AC T AC T C C TGC T GC C AGC CC T AAACC AC C T GG 160823 


350 


400 


TGGTGGACTTCTC AGGC TGGGCCACCCC C AGC CCCCT TGCTGCTTAAACCA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 

160822 GGGCGGACTTCTCAGTCTGGGCCACTCCCTGCACCCTGCCAGCCCCTGTGGCTTAAGCCG 1607 63 

401 C TGGGGAC T C - GAAGT C AGAGC T C C GTG T GAT CAGG GAAG GGC T GC T T AGGAGAGGG C AG 459 
I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I 
1607 62 CAAGGGAC TC T GGAGTCAGAGC T T C GTG TGAC C AAGGC AGGGC TGGTTAGGAGAGGGCAG 160703 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


4 60 CGTCCAGGCTCTGCCAGACATCATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAG 519 
I I I I I I I I I I I I I I I I I I I MINI III I I I I I I I I I I I I I I I I I 
160702 TGGCCAAGCTCTGCCAGGCATCAACATCAGGACCCTAAGTGAGGGCTGAGGGCCCCCAAC 160643 


520 


576 


ACCC CACTCCCGTGACCCAACCCCCACTCCAATGCTCACTCCCGTGACCCAACCCCC 

III II II I I I I I I I I I I I I I I I I I Ml II I I I I 

160642 CCCCATTCCCATCCCCCACCCCATCCCCATTTCCATCCCCATCCCCACCTCCATCCCCCA 160583 


577 


636 


TCTTCATTGTCATTCCAACCCCCACCCCACATCCCCCACCCCATCCCTCAACCCTGATGC 

I I I I I I I I I I I I I I I I I I I I I I I 

160582 CCAGAACCCCTATCCCCCACCAGAAACCCTATCCTGCCCACTCCCCACCACGTTCATCCC 160523 

637 CCATCCGCCCA-GCCATTCCACCCTCACCCCCACCCCCACCCCCACGCCCACTCCCACCC 695 

III III II II III III I I I I I I I I I I I I I I I I I I I 
160522 TACTCCCACCATTCCCATCTTCCCCACCCCTGACCCTCCTCCTCACCCTCCCACCCCCCC 1604 63 

696 C C AC C C AGGC AGGAT C C GG TTCCCGCCAGGAAACATCCGGGTGCCCG 742 

I I I I I I I I I I I I I I I Ml I I M I I I I I I I I I I I 

160462 ACACCCTGGCAGAATTCGGTTCTGCTCCTGCTTTCAACCCAGGGAATCCCTGGGTGACCA 1604 03 


743 


802 


GAT G T GAC GC C AC TGAC T T GCGC AT T GT GGGGC AGAGAGAAGCG AGGT T TC C AT T C TGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

160402 GAT G T GG TGC C AC TG T C T T GC AC AT T TGAGGT C GGAGAGAAGC AAGGGC C T C GC T C TC AG 160343 


803 


862 


GGAC GGC G T AG AGT T C GGC CGAAGGAAC C T GACC C AGGC T C T GT GAGG AGGC AAGG TGAG 
II I II I III II II II II I III III I I I I I I I I I I I I I I I I I I I I I I I 
160342 GGGCAGC-TGGAGATCAGCTGAGGGCAGCTGGCCCTGGCTCTGTGAGGATGCAAGGTGAG 160284 

863 AGG C T GAGGGAGGAC TGAGGAC C C C GC C AC T C C AAAT AGAGAGC CCC AAAT AT TC C AG — 920 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

160283 AT GC T GAGGGAGGAC T AAGGAGT AT C C C AC CCC TGG T AGT GGAC C CC AAAT AAT C C AGT G 160224 


921 


979 


-CCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGACGTCTCAGCCTGGGCTGCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
160223 CCACCTCTCCTGCTGCTAGCTCTGGACCATCCAGGGCAGGACTCCTTAGGCTGGGCCACC 160164 

980 CCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTCTTCTCCCCAAGCTCTGGAA 1039 

I I I I I I I I I I I I I I I I III I I I I I I 

160163 CCCAGTCCCCCACCGCTTAAGCCGCAGGGGA CTCAGGAG 160125 

1040 TCAGAGGTTGCTGTGACCAGGGCAGGAC TGGT TAGGAGAGGGCAGGGCACAGGCTC TGCC 1099 
I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I 
160124 ACAGAGC TTGGTATGACCAGGGCAGGAC TGGT TAGGAGAGGACAGCTC CCAGGCTC TGCC 160065 

1100 AGGCAT C AAGAT C AGC AC C C AAGAGGGAGGGC T GT GGGC C CC C AAGAC TGC AC T C C AATC 1159 

I I I I I I I I I I I I II I I I I I I II I I 
160064 AGGAAAC AAC GTC AG GAAC C T AAGGGAAAGC T GAGG C T AC CCC 160022 

1160 CCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACCCCCATCTCCTCAGCTACAC 1219 

I I I 

160021 CAC 160019 

1220 CTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACCACCCTCC AGCCCCAGCACC 1279 

I I I I II I I I I I I I I I II III I I I I I I I I II II 
160018 GCCAAACTCTATTCCTGTCCCTACCTCCGTCCCCCACCTACACCCCCCATTCC CC 159964 

1280 AGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAACCCCACCCTCATCTCTCTCA 1339 
I I I I I I I I I I I I I I I I I I I II I I I II I 
159963 CACCCCATCCCTACCGGCACCTCTATCCCACATCCCCCA 159925 
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Qy 1340 TGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCCGGTT-TGCCCCTGCTCTCA 1398 

I I I I II I I I I I I I I I I I I I II I I I I I I I I I III 
Db 159924 CCCCTATCCTGGCAGAATCCGATTCTGCCCCTGATTTCA 159886 

Qy 1399 AC C C AGGGAAGCCC T GGTAGGC CC GATG TGAAAC C AC TGAC TT GAAC C T C AC AGATC TGA 1458 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I 
Db 159885 ACCCAGGGAAGCCCTAGGGGGCCGGATGTGATGCTGCTGACTTGTGCATTGCGGGTCAGA 159826 

Qy 1459 GAGAAGC C AGG TT C AT T TAATGGT TC TG AGGGGCGGC T T GAGAT C C AC TGAGGGGAGTGG 1518 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I 

Db 159825 GAGAATCAAGG GC ATGGT TC TGAGAAGC C GAC T GAGATC AGC AGAGGGGAATGG 159772 

Qy 1519 T T T TAGGC TC T GT GAGGAGGC AAGGT GAGA- T GC TGAGGGAGGAC TGAGGAGGC AC AC AC 1577 

I I I I I I I I I I I I I I I I I I I I I I I I I ' I I I I I I I II I I I I I I II I III 
Db 159771 GC C C GGGC T C T GT GAGGAGGC AAGGT GAGACC C C C GAGGAAGGAATGAGGAAGC C C TC AC 159712 

Qy 1578 CCCAGGTAGATGGCCCCAAAATGATCCAGTACCACCCCTGCTGCCAGCCCTGGACCACCC 1637 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 159711 CCA- - GATAG AGAAC C C C AAAT AATC C AGT AC T AC C T T T GC TGC C AGC C C T GGAC C AC - - 159656 

Qy 1638 GGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCCCACTGCCACTTAACCCA 1697 

I I I I I I I I I I I II I I I I III III I I I I I I I I I I I I I I I I I I 
Db 159655 — C C AGGGC AGAC T TC TC AGGC T GGAC C T T C CC CCCTCCCCACTGCCACTTAAGCCA 159601 

Qy 1698 CAGGGCAATCTGTAGTCATAGCTT-ATGTGACCGGGGCAGGGTTGGTCAGGAGAGGCAGG 17 56 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 159600 C AAGGGAC TC T GGAG T CAG AC C TT GGT G TGAC C AGGGAAGGGC C GGT C AGGAGAGG 159545 

Qy 1757 GCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGGACCCTGGGAGGGAACT 1816 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 159544 GCAGGGGCCAGGC TCTGTCAGGCATCAAAATCAGGACCC TGAGAGAGAAT T 159494 

Qy 1817 GAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACCCCACTCACATTCCCAT 1876 

I I I I I III I I I I II II I I I I I I I I I I I I III I 

Db 15 94 93 GAGGGCCCCCACCCCAACCCCTATACCCATCCCTAACCCCATACCCACTCTACTTGCATT 159434 

Qy 1877 ACCTACCCCCTACC CCCAACCTCATCTTGTCAGAA TCCCTGCTGTC 1922 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 159433 CCCAGCCCCATCCCCACACCCTACCCCATCTTGGCAGAATCTGTTTCTTTCCCTGCAGTC 159374 

Qy 1923 AACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCAGG 1982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 159373 AAC C C AC AGAAGC C C C AGGAAT GAC AGAC AGGC AC AC C CAT T C T GAC GT C C AC AT C C AGG 159314 

Qy 1983 GT C T GAT GGAGGGAAGGGGC T TGAAC AGGGC C TC AGGGGAGC AGAGGGAGG — 2033 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 159313 GCTGAAGGAGGGAAAGGGCTTAGTATCATGAGCAGGGCCTCAGGGGAGTCTCTGCTCCTC 159254 

Qy 2034 — GC C C T AC TGC GAGAT GAGGGAGGC C TC AGAGGAC C C AGC AC C C T AGGA C 2082 

I I I I I I I I I I I llllllllllllllllllll.il I I I I I 
Db 159253 AAGCCCTGCTGGGAGTAAAGGGAGGCCTCAGGGAACCCAGGTCCTCAGGATAGGGGGTCC 159194 

Qy 2083 AC C GC AC CCCTGTCT GAGAC TGAG — GC TGC C AC TTCTGGCCT C AAGAAT C AGAAC GATG 2140 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I 

Db 159193 AC T CC AAC C C T GTC T GAGAC TGAGGCGC CTCCTCTTT CAT C C TC GGGAAT C AGAGGGATG 159134 

Qy 2141 GGGACTCAGATTGCATGGGGGTGGGACCCAGGCCTGCAAGGCTTACGCGGAGGAAGAGGA 2200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 159133 GAGAC TC AC GT CAGC AGAGGGTGGGGCC CAAC CCTGCCAGGATC AAGGAGAGGAAGAAGA 159074 

Qy 2201 GGGAGGAC TCAGGGGAC CT TGGAATCC AGATC AGT G TGGACC T C GGC C C TGAGAGG TC C A 2260 
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I II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 159073 GGGAGGAC TCAGGGT ACC T T TGAGTCCAGAAC AATGGGGACC TT TGCC CTGGGAGGTCCA 159014 

Qy 2261 GGGC ACGGTGGCCAC ATAT GGCCC AT AT TTCC TGC ATC T T TGAGGTGAC AGGACAG 2316 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 159013 GTGCACAGTGGCCACCTGTAGCCCATGCTTGCTGCACCTTCTGGGTGACAAAGAGGAGAG 158954 

Qy 2317 AGC TGTGGTC TGAGAAGTGGGGCC TCAGGTCAACAGAGGGAGGAGTTC CAGGATCC ATAT 2376 

I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 158953 GGC TGTGGTCAGAGCAGTGGTGAC TCAGGTCAGCAGAGGGAGGAGTCC CAGCATCTGCAG 158894 

Qy 2377 GGC CC AAGATG T GC C C CC T T C ATGAGGAC TGGGGAT ATC C CC GGC TC AGAAAGAAGGGAC 2436 

I I I I I I I I I I I 1 I I I I I I I I I II I I I I I I I I II I I I I II I I I I I I I I I I I I 
Db 158893 GCCCCAATGTGTGCCCCATTCATGAAGATTGGGGATA-CCTTGGCTCAGAAAGAAGGGAC 158835 

Qy 2437 TC C AC AC AGT C T GGC T GT C C CC T T T TAG TAGC TC TAGGGGGAC C AGAT C AGGGAT GGC GG 2496 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 158834 C C C AC AG AG T C TGGC TGT C C CC TGAT T T TT GC TC AG AGGGGAC C AAAT C AAGGATAGC C C 1587 75 

Qy 2497 TATGTTCCATTCTCACTTGTACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGG 2556 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 158774 TATGTGC CAAC CTCATTTGTGCCACAGGAAAGAAGT TGAAGAGC CC TC AGGGTGAT GGGG 158715 

Qy 2557 TCTTGGGGTAAAGGGGGGATGTCTACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAG 2616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I III 
Db 158714 TCTTGCAGTAAAGGGGAGCTATCTGCTCATCTCAGGGGGTTTCAGGTTGAGGAATGGCAG 158655 

Qy 2 617 GC GC T GGCAGGAAT AAAGAT GAGT GAGAC AGAC AAGGC TAT T GGAAT C C AC ACC C C AGAA 2 67 6 

III III I I I I I I I I III I I I I I I I I I I I I I I I I I I I I 

Db 158 654 GCCCCATCACG ATGAAGAGT AAC C C AC AGGAGGC C ATAGAAAC AC T C AC C C C AGAA 158599 

Qy 2677 CCAAAGGGGTCAGCCCTGGACACCTCA CCCAGGATGTGGCTTCTTTTTCAC 2727 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 158598 CCAAAGGGGTCATACCTGGACACCCCATGTGGGGGTGACAGGATGTAGC-TCCATCTCAT 158540 

Qy 2728 TCCTGTTTCCAGATCTGGGGCAGGTGAGGACCTCATTCTCAGAGGGTGACTCAGGTCAAC 2787 

I I I I I I I I I I I I I I I III I I I I I II I I II I I I I I I I I I I I I I II I I I I I I I I 
Db 158539 TCCTGTTTT C AGATC TCGGGGAGG T GAGGAAC TT GT T C TC CGAGGATGAC TC AGGT CAAC 1584 80 

Qy 2788 GTAGGGACCCCCATCTGGTCTAAAGACAGAGCGGTCCCAGGATCTGCCATGCGTTCGGGT 2847 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III 
Db 158479 ACAGGGGCCCCCATCTGGTGGATAGACAGAGTGGTCCCAGGATCTGTCAGTAGTTCCGGT 158420 

Qy 2848 GAGGAAC ATGAGGGAGGAC TGAGGGTAC CCCAGGAC CAGAACAC TGAGGGAGAC TGCACA 2907 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I II I III III 
Db 158 419 GAGGAAC ATGAGGGAC GAT TGAGGGCAC CC T T GGGC C AGAAC AC AGATGAGGAC C T CACG 158360 

Qy 2908 GAAATCAGCCC TGCC CC TGC TGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAGGT 2967 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 158359 GAAATCTGCCCTGCCCCTGCTGTCACTCCAGAGAGCATGGGCAGGGCTGTCTGCTGCAGT 158300 

Qy 2968 CCTTCCG — TTATCCTGGGATCATTGATGTCAGGGACGGGGAGGCCTTGGTCTGAGAAGG 3025 

II III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III III III I 

Db 158299 CCCCCCGACTTACCCTGGGATCATTGGTGTCAGGGATGGGGAGGTCTTTGTC-GAGGGGT 158241 

Qy 3026 CTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCCCTGCCAGGAGTCAAGGTGAGGACCA 3085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II II I 
Db 158240 C TGC ACT C AGGT C AG TAGAGGGAGC GT C T T AGGC C C T GC C AGGAGAC AAGGT AAGAAC GA 158181 

Qy 3086 AGCGGGCACCTCACCCAGGACACATTAATTCCAATGAATTTTGATATCTCTTGCTGCCCT 314 5 

III II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III III 
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Db 158180 AGCAGGTTCCTCACCCAGGACACATGAATTCCAATGCATTTCAGCATCTCTTCCTGTCCT 158121 

Qy 3146 TCCCCA-AGGACCTAGGCACGTGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCT 3204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I 

Db 158120 TCCCAAGAGGACCTGGGCACGTGTGGCCAGATGTGAGTCTCCTCATGTCCT GTTCCC 158064 

Qy 3205 TAT C AT GGAT G T GAAC T C T T GAT T TGGAT T TC TC AGACC AGC AAAAGGGC AGGAT C C AGG 3264 

I I I I I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 158063 TATCAGGGATGTGAGCTCTTAATCTGAGTTTCTCAGGCCAGCAAAAGGGTGGGATCCAGG 158004 

Qy 3265 C C C T GC C AGGAAAAATATAAGGGC C CT GCGTGAGAACAGAGGGGGT C ATC C AC T GC AT GA 3324 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I 
Db 158003 C C T T GC C AGGAGAAAGGTGAGGGC C CT G TGTGAGC AC AGAGGGGAC C AT TC AC C C C AAGA 157944 

Qy 3325 GAG T GGGGATG TCAC AGAG T CC AGC CC ACC C TCC TGGTAGC AC TGAGAAGC C AGGGC T GT 3384 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 157943 GGG TGGAGAC C TCAC AGAT T C C AGC CT ACC C TCC TG T TAGC AC TGGGGGC C T GAGG C T GT 157884 

Qy 3385 GCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCAGGAACCAGG 3444 

I I I I I I I I I I I I I I I I I I II I I I II II I I I II I I I I I I I I I I I I I I M I I I III 

Db 157883 GC T T GC AGTC T GC AC C C TGAGGGC C CAT GCAT TCCTCTTC C AGG AGC T C C AG GAAAC AGA 157824 

Qy 34 45 C AG T GAG GCC T TGGT C T GAGAC AG T ATC C TC AGGTC AC AGAGC AGAGGAT GC AC AG 3500 

II I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I ! I I I I I III 

Db 157823 C AC T GAGGC C T TGGT C T GAGGC C G T GC C C T C AGGTC AC AGAGC AGAGGAGAT GC AGAC GT 1577 64 

Qy 3501 GGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAGGA 3560 

M I I I I I I I I I I I I I I I I I II I I M I I I I I I I II I I II I I III III I 

Db 157763 CTAGTGCCAGCAGTGAACGTTTGCCTTGAATGCACACTAATGGCCCCCATCGCCCCAGAA 157704 

Qy 3561 CACATAGGACTCCACAGAGTCTGGCCTCA-CCTCCCTACTGTCAGTCCTGTAGAATCGAC 3619 

II II I I I II I I I II MINIMI I I I I I 1 J 1 I I I I I I I I I I I MINI I 
Db 157703 CATATGGGACTCCAGAGCACCTGGCCTCACCCTCTCTACTGTCAGTCCTGCAGAATCAGC 157644 

Qy 3620 CTCTGCTGGCCGGCTGTACCCTGAGTACCCTC TCAC T TCC TCC TTCAGGTTTTCAGGGGA 3679 

I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 157643 CTCTGCTTGCTTGTGTACCCTGAGGTGCCCTCTCACTTTTTCCTTCAGGTTCTCAGGGGA 157584 

Qy 3680 C AGGC C AACC C AGAGGAC AGGAT TCCC TGGAGGCCACAGAGGAGCAC 372 6 

I I I I I III II II II I I I I I I I II I I I I I I I I I I I I M 

Db 157583 C AGGC T GAC C AGGAT C AC C AGGAAGC TC C AGAGGAT C CC C AGGAGGC C C T AGAGGAGC AC 157 524 

Qy 3727 C - AAGGAGAAGAT C T G T AAGT AGGC C T T TGT TAGAGTC TC C AAG GT TC AGT T C T C AGC TG 378 5 

I I I II I I I II I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I II I 
Db 157523 C AAAGGAGAAGAT C T GT AAGT AAGC C T T TGT T AGAG C C T C C AAGGT T C AG T T T T TAGC T G 1574 64 

Qy 3786 AGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGC 3845 

I I I I I I I M I I I I I I I I II I I I I I II I I I I I II I I I I II I I I I II I M I I I I II 
Db 157463 AGGCTTC TCAC ATGC TCCC TCTCTCTCCAGGCCAGTGGGTCTCCATTGCCCAGCTCCTGC 157404 

Qy 3846 CCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGC 3905 

I I I I I I I I I I I I I I I III I I I I I I I I I I M I I I I I II I I I I II I I I I I II I II 

Db 157403 CCACACTCCTGCCTGTTGCGGTGACCAGAGTCGTCATGTCTCTTGAGCAGAAGAGTCAGC 157344 

Qy 3906 ACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGC 3965 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 157343 ACTGCAAGCCTGAGGAAGGCCTTGACACCCAAGAAGAGGCCCTGGGCCTGGTGGGTGTGC 157284 

Qy 3966 AGGC T GCC AC CTCCTCCTCCTCTCCTCTGGTCCTGGGCA 4004 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 11 I I 

Db 157283 AGGC TGCCACTACTGAGGAGCAGGAGGCTGTGTCCTCCTCCTCTCCTC TGGT CCCAGGCA 157224 
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Qy 4005 CCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCT 4064 

I I I I I I I I I I I I I I I I I I I I I I I I I I III I I II I I I I I I I 1 I I I I I I I I I I I I 
Db 157223 CCCTGGGGGAGGTGCCTGCTGCTGGGTCACCAGGTCCTCTCAAGAGTCCTCAGGGAGCCT 157164 

Qy 4065 CCGCCTTTCCCACTACCATCAACTTCACTCGACAGAGGCAACCCAGTGAGGGTTCCAGCA 4124 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I MM I I I M I I 
Db 157163 CCGCCATCCCCACTGCCATCGATTTCACTCTATGGAGGCAATCCATTAAGGGCTCCAGCA 157104 

Qy 4125 GCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAA 4184 

II I I II I I I I I I I I I I I I II I I I I I I II I I I I I I II I I I I I I I II I 
Db 157103 AC C AAGAAGAGGAGGGGC C AAGC AC C TC C CC T GAC C C AGAGTC T GTGT T C C GAGC AGC AC 157044 

Qy 4185 TC ACTAAGAAGGT GGC T GAT T T GG T TGG TTTTCTGCTCCT C AAATATC GAGC C AGGGAGC 4244 

III I I M I I I II I II I I I III II I I I I I I I II II II I I III II II I I I II 
Db 157043 T C AG T AAGAAGGT GGC T GAC T T GAT T CAT TTTCTGCTCCT C AAG TAT T AAG T C AAGGAGC 156984 

Qy 4245 C AG TC AC AAAGGC AGAAAT GC T GGAGAG T G TC ATC AAAAAT T AC AAGC AC TGTTTTCCTG 4304 

I I I I I II I I I I II I I I I I I I I I I I I II I II I II II II II IE I I II I III I I I I I I I 
Db 156983 CGGTCAC AAAGGC AGAAAT GCTGGAGAGAGTCATCAAAAATTAC AAGC GCTGCTTTCCTG 156924 

Qy 4305 AGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAG 4364 

I II II I II I I I I I II II I I I I I I I II I I II I II I I II II II I I II I II I I II I I II I I 
Db 156923 TGATC T T C GGC AAAGC C TC C GAGT C C T T GC AGC TGG TC T T T GGC AT TGAC GT GAAGGAAG 156864 

Qy 4365 CAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCC 4424 

I I I I II I I I I M II I I I I I I I I I I I II I I I I I I II I I I I I I II I I I I I I 

Db 156863 CGGACCCCACCAGCAACACCTACACCCTTGTCACCTGCCTGGG — ACTCCTATGATGGCC 156806 

Qy 4425 TGCTGGGTG ATAAT C AGAT CAT GC C C AAGAC AGGC T T C C T GAT AAT T GTCC T GGT C A 4481 

II III II I I II I I I I I M I I I I I I I I I I I III I I I I I I I I I I Ml III II 

Db 156805 TGGTGGTTGATAATAATCAGATCATGCCCAAGACGGGCCTCCTGATAATCGTCTTGGGCA 156746 

Qy 4482 TGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGA 4541 

I I I I II I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I II I I I I I I I I II 

Db 15 67 4 5 TGAT T GC AAT GGAGGGC AAATGCG T C C C T GAG GAGAAAAT C TGGGAGGAGC T GAGT G T GA 15668 6 

Qy 4542 TGG AGGT GTAT GATGGGAGGGAGC AC AG T GCC TAT GGGGAGC C C AGGAAGC T GC T C AC C C 4601 

II II I I I I I I I II II I I I I I I I I II I I I II I II I IE I I I I II I II I I II I I II I II 

Db 156685 TGAAGGTGTATGTTGGGAGGGAGC AC AGTGTCTGTGGGGAGCCC AGGAAGC TGCTCACCC 156626 

Qy 4602 AAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCAC 4 660 

I I II I I II I I I I I I I I I I I I I I I I I II I I I I II I I I II I I I II I II I I I I I I 
Db 156625 AAG AT T T GG T GC AGGAAAAC T ACC T GGAGT AC C GGC AGGT GC C C AGC AGTGAT C C CAT AT 156566 

Qy 4 661 GCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTG 4720 

I II I I II I I I II I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I 

Db 156565 GCTATGAGTTACTGTGGGGTCCAAGGGCACTCGCTG CTTGAAAGTACTGG 156516 

Qy 4721 AGT AT GT GATC AAGGT C AG T GCAAGAG TTCGCTTTTTCTTCC C ATC C C T GC G T GAAGC AG 4780 

II I III III I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I II 

Db 156515 AGCACGTGGTCAGGGTCAATGCAAGAGTTCTCATTTCCTACCCATCCCTGCATGAAGCAG 156456 

Qy 4781 C T T TGAGAGAGGAGGAAGAGGGAG T C TGAGC AT GAG T T GC AGC C AAGGC C AG TGGG AGGG 4840 

I I II I I I II II II I I I I I I II I I I I I I I I I I I II I I II I I I II I I I I I I II I II I I 

Db 156455 C T T TGAGAGAG GAGGAAGAGGGAG T C TGAGC AT GAG C TGC AGC C AGGGC C AC T GC GAGGG 156396 

Qy 4841 GGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCC-TCGTGTGAC 4899 

II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I II I I I I I II I II I I II 

Db 156395 GGGCTGGGCCAGTGCACCTTCCAGGGCTCCGTCCACTAGTTTCCCCTGCCTTAATGTGAC 156336 
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Qy 4900 ATGAGGCCCATTCTTCACTC — TGAAGAGAGCGGTCAGTGTTC TCAGTAGT AGGT TTCTG 4957 

I I I I I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 156335 ATGAGGCCCATTCTTCTCTCTTTGAAGAGAGCAGTCAACATTCTTAGTAGTGGGTTTCTG 156276 

Qy 4 958 TTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTT 5017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 156275 TTCTATTGGATGACTTTGAGATTTGTCTTTGTTTCCTTTTGGAATTGTTCAAATGTTCC- 156217 

Qy 5018 T T T TAAGGGAT GGT T GAATGAAC T T C AGC ATC C AAG T T T ATGAATGAC AGC AGT C AC AC - 507 6 

I I I I I I II I I M I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I II I I 

Db 156216 T T T TAAT GGGT GGT T GAATGAAC T T C AGCAT T C AAAT T T ATGAATGAC AGT AGTCACAC A 156157 

Qy 5077 -AGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCC 5135 

III I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 156156 TAG TGC T GT T T ATAT AGT T TAGGAG T AAGAGT CTTGTTTTT TAT TC AGAT TGGGAAAT C C 156097 

Qy 5136 AT T C TAT T T TG TGAAT TGGG — ATAATAACAGCAGTGGAATAAGTAC T TA- GAAATGTGA 5192 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 

Db 156096 AT T C C AT T T TG TGAAT TGGGAC AT AGT T AC AGC AGT GGAAT AAG TAT T CAT T T AGAAAT G 156037 

Qy 5193 AAAAT GAGC AG T AAAAT AG AT G AG AT AAAGAAC T AAAGAAAT T AAGAG AT AG T C AAT TC T 5252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 156036 TGAAT GAGC AG T AAAAC T GAT GAC A T AAAGAAAT T AAAAGAT AT T T AAT TC T 155985 

Qy 5253 TGCCTTATACCTCAGTCTATTCTGTAAAA — T T T T T AAAGATAT AT GC AT AC C T GGAT T T 5310 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I II I I I I II I I I I I I I M 

Db 155984 TGCCTTATA-CTCAGTCTACTCGGTAAAATTTTTTTTAAAAAATGTGCATACCTGGATTT 155926 

Qy 5311 CC T T GGC T TC T T TGAGAAT GT AAGAGAAAT T AAATC TGAAT AAAGAAT TCTTCCTGTT C A 5370 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 155925 CC T TGGC T TC T T TGAGAAT GTAAG AC AAAT T AAATC T GAAT AAATC AT TCTCCCTGTT C A 1558 66 

Qy 5371 CTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCTGGGTTAGTAG 5430 

I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I II I I I III 

Db 155865 CTGGCTCATTTATTCTCTATGCACTGAGCATTTGCTCTGTGGAAGGCCCTGGGTTAATAG 155806 

Qy 54 31 TGGAGATGCTAAGGTAAGCCAGAC TCATACCCACCC ATAGGGTCGTAGAGTC TAGGAGCT 54 90 

I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I I I I I 

Db 155805 TGGAGAT GC TAAGGT AAGC CAGAC TCAC CCC T ACCC ACAGGGTAGTAAAGTC TAGGAGC A 155746 

Qy 54 91 GC AGT C AC GTAAT C G AGGT GGC AAGATG T C C T C TAAAGAT GT AGGGAAAAGT GAGAGAGG 5550 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 155745 GC AGT CATAT AAT TAAGGT GGAGAGGT GC CC T C T AAG AT G TAGAGAAAAAGT AAGAAAGG 155686 

Qy 5551 GGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCAT 5610 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I III II II I I I I I I I 

Db 155685 GGT GAGGGTGTGGGGCTCCAGGTGAGAGTGGTCCAGAGGT AAAT GCCCTGTGTGGGGCCT 155626 

Qy 5611 TTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGG 5670 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 155625 T T T GGAC T T T GGGAAAC TGC AGT T TC T T C GGAGGGAGC T GAT TC TAAT GAAT C GGC GGGG 155566 
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REFERENCE 1 (bases 1 to 11495) 
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TITLE Vaccines with enhanced intracellular processing 
JOURNAL Patent: US 6287569-A 9 ll-SEP-2001; 
FEATURES Location/Qualifiers 
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ORIGIN 

Query Match 46.8%; Score 2655; DB 2; Length 11495; 

Best Local Similarity 73.6%; Pred. No. 0; 

Matches 4231; Conservative 0; Mismatches 1100; Indels 416; Gaps 50; 

Qy 21 CCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCCATCCAAACATCTTCACGCTC 80 

I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5969 CCAGCACCCCTATCCTCCCCAAACCCCCACTACCCTTATGTCCTCATCCCCCACCCCAAC 6028 

Qy 81 ACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTGCTCTCAACCCAGGGAAGC-C 139 

I II I I I I I I I I I M I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I 
Db 6029 ACCACTATCCCCATCCAGGTTGAATCGCATTCCGTTTCTGCTTTCAACCCAGGGAAGCTC 6088 

Qy 140 C AGGT GC C C AGAT GT GAC GCC AC T GAC T T GAG C AT T AGT GGT T AGAGAGAAGCGAGGT TT 199 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II 
Db 6089 CAGGTTCCTGGATGTGATGCCAGTGACTTGTGCATTGGGGGTTAGAGAGACGCTAGCTTC 6148 

Qy 200 TC GGT C T GAGGGGC GGC T T GAGAT CGGT GGAGGGAAGC GGGC CCA- GC T C T GT AAGGAGG 258 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6149 TCAGTCTGACAGGCAGCTTGGGATTGGCAGAGGGAAGCCGGTCCAGGCTCTGTGAGGTGG 6208 

Qy 259 C AAGGT G AC AT GC TGAGGGAGGAC T GAGGACCCACTTACCCCAGATAGAGGACCCCA 315 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 6209 C AT AGTG AGAAGC TGAGGG AGAAG T C GGGAGG C C C T C TC C AC CC C AGATAGACGAC C C C A 62 68 

Qy 316 AATAATCC CTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTCTCAGGC 366 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 62 69 AATAATCCGGCACCCCTCCTGCTTCCAGTCCTGGGCCACCCGTGGGCGGACTTCTGAGTC 6328 

Qy 367 TGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAGCTCCGT 42 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 

Db 6329 TGGGAC GCC C AC C AC C C C AC T GC C GC T GAAGC C GC AGGGAC TATGGAG T C AGAGC T T GGT 6388 

Qy 427 GTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACATCATGCT 48 6 

I I I I I I I I I I II I I I I II I I I I M I I I I I I II I I I I 

Db 6389 GTGATCAGTGCAGGACTGGTGGGGGT AGGCTCTGCCAGGCATCAACGT 64 36 

Qy 487 C AGGAT T C T C AAGGAGGGC T GAGGGTC C C TAAGACC C C AC TCC CGT GAC CC AAC C C C C AC 546 

I I I I I II I I I I I I I I I I I I I I I I I I I I II Ml I I I I 
Db 6437 C AG GAC C C TAG GAGAGGGC T G AGT GT C C C C C A CCCCCATTCCTATCCCCTACCCCTT 6493 

Qy 547 TCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCACCCCAC 606 

I I I II I I I I I I I III I Mil 

Db 64 94 TCCCATCTGCACTCCC TACCCCATCTGTACCCCC 6527 

Qy 607 ATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCTCACCCC 666 

I I I I I I I I I III III II II I I I I I I I I I I I I I I 

Db 6528 ATTCCCCACCTGTGCCCCTATCCTCCCCAACCCCCCAACCAGCCTCATACCCCCCTCCCC 6587 

Qy 667 CACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCG-GTTCCCGCCAGG 725 
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1 1 1 1 1 1 1 1 1 II 1 1 1 1 I I II I II III 1 1 1 1 1 

Db 6588 CACCCCTACCTTCATCCCCATCAGTGCAGCATCCGGTTCCACCCCTGCTTTCAATCCAGG 6647 

Qy 726 AAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGAGAAGC 785 

II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 
Db 6648 CAAGCCCTGGGTGGCCGGATGTGATGCCACTGACTTGTGAATTGAGGGTTAGAGAGAAGT 6707 

Qy 786 GAG GT T T C CAT TC TGAGGG AC GGC GT AGAG T T C GGC C GAAGGAAC C TGACC C AGGC T C TG 845 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6708 GAGTTTCTGGGTCTGAAGGGTGGC-TTGAGATCGGCAGAGGGAAGGTGGCCCAGGCTTTG 67 66 

Qy 84 6 TGAGGAGGC AAGGTGAGAGGC T GAGGGAGGAC T GAGGACC C C GCC AC T CCAAAT AG AGAG 905 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I 
Db 6767 TGAAGAGGCAAAGTGAGAC TC TGAGGGAGGAT TCAGGAAACCCC TATC CCTGATAGAGGG 6826 

Qy 906 CCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGACGTCT 965 

I I I I I III I II II Mi III 

Db 6827 TCCCAGCCCTGGACTACCC CGCGGAGGC TGAC TTCT 68 62 

Qy 966 CAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTCTTCTC 1025 

I I I I I I I I I I I I II I I I I I I I II I II 

Db 6863 CAGACTGGGCTGCTCCCCACCTCCGCCCCC TTCGCAACGCGTTTGTTTAAGCCAC 6917 

Qy 1026 CCCAAGCTCTGGAATCAGAGGTTGCTGTGACCAGGGCAGGACTGGTTAGGAGAGGGCAGG 1085 

I II I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 
Db 6918 AGGGGACTCTGGAGTCAGAGGTTGGTGTGATCAGGGAAGGGCTGGTTAGGAGA-GGCATG 6976 

Qy 1086 GC AC AGGC T C T GC C AGGC AT C AAG AT C AGC AC C C AAGAGG GAGGGC T G T GGGC C C C C AAG 1145 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6977 GC C C AGGC C C T GC C AGGAAT CAAAGT C AGAAAC C - TGAGAGGGAAC TG AGGT C C C C C AAG 7035 

Qy 1146 ACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACCCCCAT 1205 

I I II II I I I I I I I I I I I I 
Db 7036 ATCCTAGTCTAACCCCCACTCCCACAA 7062 

Qy 1206 CTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACCACCCT 12 65 

I I I I III I I I I I I I II I I I I I 

Db 7063 ATCCGCTGCCATTTCGCTGCTCCATTTCCCATTCCTTGCCCT 7104 

Qy 1266 CCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAACCCCAC 1325 

III II II II 

Db 7105 CCACCCTCACCA 7116 

Qy 1326 CCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCCGGTTT 1385 

I I I I I I I I I I III 

Db 7117 GGCAGAATCCAGTTC 7131 

Qy 1386 GCC -CCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCAC TGAC TTGAA 1444 

II I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 7132 CCCTTCTGCTATCAATCCAGGGAAACCCCAGGCTTGGTGCTGGGATGTTTTT 7183 

Qy 1445 CC T CACAGATC TGAGAGAAGCCAGGTTC AT T T AATGGTTC TGAGGGGC GGC T TGAGATCC 1504 

I I I I I I I 1 I I I I I I I II I I I I I I I I II 

Db 7184 TGGGGGT C AGAGAAT C AAGGGC AT AGTC C TGAGGGGC CAGT T GAGATC G 7232 

Qy 1505 AC T GAGG GGAG T GGT T T TAGGC T C TGTGAGGAGGC AAGGT GAGATGC T GAGGGAGGAC TG 1564 

I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I 

Db 7233 GCTGAGGGGAGCGGGCCCAAGCTCTGTGGCGAGGCAAGGTGAGACTCTGAGGAAGGACTG 7292 

Qy 1565 AGGAGGC AC AC AC C C C AGG T AGAT GGC C CC AAAATGATCC AGT AC C AC C C C T GC T GC C AG 1624 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 7293 AGGAGGC C C C C ACC C AAGAT AGA- GGAAC C C AAAT AAT C C AGC GC AGC TCCTGCTGC C AG 7 351 

Qy 1625 CCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCCCACT 1684 

I I I I I I I I I I I I I I II III I I I I I III II I I I I I I I I 

Db 7352 TCCTGGACCACCCGG GGGAAGAC T T C TC A GGC T AGGC C AT CC C AGC TC C C AC T 7404 

Qy 1685 GCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTTGGTC 1744 

I I I I I I I I I I I I II I I I I I I I I I I. I III I 

Db 7405 GCCACTAAAGCTACAGGGGACTCTAGAGTCAAGAGCTTGGTGTGCCCA 7452 

Qy 174 5 AGGAGAGGC AGGGC C C AGGC ATCAAGGT C C AGC ATC C GC C C GGC AT TAGGGT C AGGACC C 1804 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7453 AGGC AGGGC C C AGGC TCTGCCTGGCATCGGGGTCAGGACCT 7493 

Qy 1805 T GGGAGG GAAC T GAGGGT TC C CC AC C C AC AC CTGTCTCCT CATC TC C AC C GC C AC C C C AC 18 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

Db 74 94 TGAGAGGGAAC TGAGGGC GC TAC AC C C C C AC C C CAT C C GC ATTC CAACAT 7543 

Qy 18 65 TCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTGTCAA 1924 

III I I II I I I I I I I II II Ell I II I II I I I I 

Db 7544 GCCCAGCCCCATCCCCAACTCCGTTTTGCAGAATCCATTTTT TCCCCTGCAGTCAA 7599 

Qy 1925 CCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCAGGGT 1984 

III I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I III I I I I I I I I 

Db 7600 C C C C GGGAAGAC C T G GGAATGGT C AGGC AC T C GGAT C T T GAC AT C C AC AT C G AGGGC 7 65 6 

Qy 1985 CTGATGGAGGGAAGGGG C T T GAAC AGGGC C T C AGGGGAGC AGAGGGAG 2032 

II II I I I I I I I I I II I E I I I I I I I I I I I I I I I I I I 

Db 7 657 TGAAGGAGGGAGAGGGTTTGGTATCATGAGCAGAGC C TCAGGGT AGCAGAGGGAGGACCC 7716 

Qy 2033 - GGC C C TAC T GC GAGATGAGGGAGGC C T C AGAGG AC C C AGC AC C C TAGGAC 2082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 7717 TGGC C C T C C T GGGAGAT GAGGAAGGC C T C AGGAGAC C C AGC AC C C C AAGGC AGGGAGCC C 7776 

Qy 2083 AC C GC AC CCCTGTCT GAG AC TGAG - - GC TGC C AC T T C T GGC C T C AAGAATC AGAAC GAT G 2140 

I I I I I IE I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 7777 AC C C C AC CCCTGTCT GAGAAT GAG GT GC CTCCTCTTT T AGC C T C AGGAATC C AAGGGAT G 7836 

Qy 2141 GGGAC TC AGAT TGC AT — GGGGGTGGGACCC AGGC CTGCAAGGCT TAC GCGGAGGAAGAG 2198 

I I I I I II I I I I I II I I I I It I I I I I I I I I I I I I I I 

Db 7837 GCAACTCAGGTCAGCAGAGGGGTGGGTTCCAAGCCCTTCCAGGATCAAGGAAAGGAAGAC 7896 

Qy 2199 GAGGGAG GAC T C AGGGGAC C T TGG AAT C C AGAT C AG T GTGGAC C T C GGC C C T GAGAGGT C 2258 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I 
Db 7897 GAGGGAGGAT T C AGGGGGC C T T GC AT TC C AGAT C AG TGGAGAC C T GGGC C C T GGGAGGT C 7956 

Qy 2259 CAGGGCACGGTGGCCACATATGGCCCATATTTCCTGCATCTTTGAGGT GACAGGAC 2314 

I I I I I I III I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 7957 C T GGGC AAGG T AGC C AC C T G T AGC TC AT AC T TC C T G CAT C T TC GAGGT C AC AGAGAGGAG 8016 

Qy 2315 AGAGC T G T GGT C TGAGAAG T GGGGC C T C AGG T C AAC AGAGGGAGGAGT T C C AGGAT C CAT 2374 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8017 AGGGC T AT GGT C TGAGGGGTGGT AC TTCAGGTCCGCAGAGGGAGGAGTCCC AGGAT C TAC 8076 

Qy 2375 ATGGCCCAAGATGTGCC-CCCTTCATGAGGACTGGGGATATCCCCGGCTCAGAAAGAAGG 2433 

I I I I I I I I I I I I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I I I I I I II 
Db 8077 AGG AC C C AAGG T GTG CC AC AC T T C AC GAGGAAT GGGGAT AC C T G T GGC T C AGAAAGAC GG 8136 

Qy 2434 GACTCCACACAGTCTGGCTGTCCCCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGG 24 93 

III I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I 

Db 8137 GACCCCACAGAGTCTGGCTGTCCCCTGTTCTTAGCTCAGGGGGGACCAGAGGAGGGATGG 8196 
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Qy 2494 CGGTATGTTCCATTCTCACTTGTACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATG 2553 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I'M I I I II I I I I I I I I I I I 
Db 8197 CC C T ATG TGC C AAT T T C AC T TGT T C C AC AGGC AGGAAGT T GGGGAACC T T C AGGGAGAT G 8256 

Qy 2554 GGGTCTTGGGGTAAAGGGGGGATGTCTACTCATGTCAGGGAATTGGGGGTTGAGGAAGCA 2613 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8257 AGGTTTTGGAGTAAAGGGGCAATGTTTGCTCATCTCAGGGGGTTGGGGGTTGAGGAAGGG 8316 

Qy 2614 C AG GCGC T GGC AGGAAT AAAGATGAGT GAGAC AGAC AAGGC T AT TGGAATC C AC AC C CC A 2673 

I I I I I I I I I I I I I I I I I I I I II I III II I I I I I I I II I I I I I I I 
Db 8317 C AG GC CC TGTC AGGAGC AAAC AT GAGT - ACC C AC AGG AGGC CATC AGAACC C T C AC C CCA 837 5 

Qy 2674 GAACC AAAGGG GT C AGC C C T GGAC AC C T C AC C C AG GATGTGGCTTCTTTTTC 272 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8376 GAACCAAAGGGGTCAGCCCTGGGCACCCCACACAGGGGTGACAGGATGTGGCTCCTTCTC 8435 

Qy 2726 ACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCTCATTCTCAGAGGGTGACTCAGGTCA 2785 

I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8436 AT T TC TGAT TC C AGATC TC AGT GAGGT GAGGAC C T T GTTC TC AGAGGG T GAC T C AGGT C A 8495 

Qy 2786 ACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCGGTCCCAGGATCTGCCATGCGTTCGG 2845 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I 
Db 84 96 CCACAGGGACCCCCATCTGGTCTACAGACACAGTGGTCCCAGGATCTGCCAAGAGTCCTG 8555 

Qy 2846 GTGAGGAACAT GAGGGAGGACTGAGGGT ACCCCAGGACCAGAAC AC TGAGGGAGAC TGC A 2905 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III II 
Db 8556 GT GAGGAAT GT GAGGGAGGAT T GAGGGT AC C AC AGGGCC AGAAC GC AG AT GAT GAC C C C A 8615 

Qy 2906 CAGAAATCAGCCCTGCCCCTGCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAG 2965 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I III 
Db 8616 CAGAAATCAGCCCTGCTCCTGTTGTCACCCCAGAGAGCATGGGCTTGGCTTTCTGCTGAG 8675 

Qy 2966 GTCCTTCCGTTATCCTGGGATCATTGATGTCAGGGACGGGGAGGCCTTGGTCTGAGAAGG 3025 

I I I I II I I I I I I I I I I I I I I II I I II I III I I I I I I I I I I I I I I I I I I II 
Db 8676 GTCCCTCTCTTATCCTGGGATCACTGGTGTCACGGAGTGGGAGGCCTTGGTCTGAGGGGG 8735 

Qy 3026 C T GC GC T C AGG T C AG T AGAGGGAGC GT C CC AGGC CC T GC C AGGAGT C AAGGT GAGGAC C A 3085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8736 C T GC AC C C AGG T C AG T AGAGGGAGGGT C CC AGGC TC TGC C AGGAGT TGAGGT GAGGAC C A 8795 

Qy 3086 AGC GGGC AC C T C AC C C AGGAC AC AT TAAT T C C AATGAAT T TTGAT AT CTCTTGCTGCCCT 3145 

III III II II II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I 
Db 87 96 AGCAGGCTCCGCATCCAGGACACATGGGTTCCAATGAATTTCGACATCTTTTGCTGTCGT 8855 

Qy 3146 TC-CCCAAGGACCTAGGCACGTGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCT 3204 

I I I I I I I I I I I I I I I II I I I I I I I II I | II I I I I I I I I I 

Db 8856 TCTTCGGAAGACCTAGGCAC AGGT GGCCAGATGTGGGGTTTCTT AGGT CCT GTTCCC 8912 

Qy 3205 TAT CAT G GATG T GAAC T C T TGAT T T GGAT T T C TC AGACC AGC AAAAGGGCAGGAT C C AGG 3264 

I III I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8913 TCTCAGGCATGTGAGCTCTTGATCTGAGTTTCTCAGGCCAGCAAAAGAGTGGGATCCAGG 8972 

Qy 3265 CCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCCACTGCATGA 3324 

II I I I I I III I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8973 CCCTGCCTGGAGAAATGTGAGGGCCCTGAGTGAACACAGTGGGGATCATCCACTCCATGA 9032 

Qy 3325 GAG T GGGGATG TC AC AGAG TC C AGC CC ACC C T C C TGG TAGC AC T GAGAAGC C AGGG C T GT 3384 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I 
Db 9033 GAGTGGGGACCTCACAGAGTCCAGCCTACCCTCTTGATGGCACTGAGGGACCGGGGCTGT 9092 


http ://es/ScoreAccessWeb/GetItem . acti on? Appld=088 1 9669&seqld=6095 1 6&ItemName=us. 


Qy 3385 GCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCAGGAACCAGG 3444 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 9093 GC T T AC AGTC T GC AC C C TAAGGGC C CAT GGAT TC C T C TCC T AGGAGC T C C AGGAAC AAGG 9152 

Qy 34 45 CAG TGAGGCC T TGGTC TGAGACAGTATC C TCAGGTC ACAGAGC AGAGGATGC ACAGGGTG 3504 

I I II I I I I t I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 9153 CAG T GAGGC C T T GG T C TGAGAC AG TGTC C TC AGGT T AC AG AGC AGAGGATGC AC AGGC T G 9212 

Qy 3505 TGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAGGACACA 3564 

I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 9213 TGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAAGACACA 9272 

Qy 3565 TAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAATCGACCTCTG 3624 

II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I III I I I II I II I I I I I I I I I I I 

Db 9273 TAG GAC T C C AAAGAG TC T G GC C T C AC C T C C C T AC C ATC AATC C TGC AG AATC GAC C TC T G 9332 

Qy 3625 CTGGCCGGCTGTACCCTGA-GTACCCTCTCACTTCCTCCTTCAGGTTTTCAGGGGACAGG 3 683 

I I I I I I I I I I I I II I I I I II I I I II I I II I I I I I I I I I I I I I I I II II I I I I 

Db 9333 CTGGCCGGCTATACCCTGAGGTGCTCTCTCACTTCCTCCTTCAGGTTCTGAGCAGACAGG 9392 

Qy 3684 CCAACCC AGAGGACAGGAT TCCC T GGAGGCCACAGAGGAGC ACC AAGGAGAAGATC TGTA 3743 

I I II I I II I I I I I I I I I II I I I I I I [ I I I I [ I I I I I I I II I I I I I I I I I I I M I I I I I 

Db 9393 CC AACCG - GAGGACAGGATTC CC TGGAGGCCAC AGAGGAGC ACCAAGGAGAAGATC TGTA 94 51 

Qy 3744 AGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGC TGAGGCC TCTCACACAC TCC 3803 

I I I I I I I I I I I I I I I II III III II I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 9452 AGT AAGC C T T T GT TAGAGC C TC TAAGAT T T GG T T C T C AGC TGAGG T C T C T C AC ATGC TCC 9511 

Qy 3804 CTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTG 3863 

I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 9512 CTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCCAGCTTTTGCCTGCACTCTTGCCTGCTG 9571 

Qy 3864 C C C T GAC GAGAGT C AT CAT G TC TC T TGAGC AGAGGAGTC T GC AC T GC AAGC C TGAGGAAG 3923 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 9572 C C C T GAC C AGAGT C AT CAT GTC T T C TGAGC AGAAGAGTC AGC AC T GC AAGC C T GAGGAAG 9631 

Qy 3924 CCC T TGAGGC C CAACAAGAGGCCC TGGGCC TGGTGT GTGT GC AGGC TGC CAC 3975 

I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I III I I I I I I I II 

Db 9632 GCGT TGAGGCC CAAGAAGAGGCCCTGGGCCTGGTGGGTGCACAGGCTCCTACTAC TGAGG 9691 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGC 4019 

I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 9692 AGCAGGAGGC TGC TGTC TCC TCC TCCTC TCC TCTGGTCCCTGGCACCCTGGAGGAAGTGC 9751 

Qy 4020 CCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTA 4079 

I I I I I I I MM III I I I I II II I II I I I II I I I II II II I I I I I I I II I I II I 

Db 9752 CTGCTGCTGAGTCAGCAGGTCCTCCCCAGAGTCCTCAGGGAGCCTCTGCCTTACCCACTA 9811 

Qy 4080 C CAT C AAC T T C AC T C GAC AGAGGC AAC C C AGT GAGGGT T C C AGC AGC C GT GAAGAGGAGG 4139 

I II I I I I II I I I I I I II I II I I II I II I II I II I I I I I II II I I II I II II I 

Db 9812 CCATCAGCTTCACTTGCTGGAGGCAACCCAATGAGGGTTCCAGCAGCCAAGAAGAGGAGG 9871 

Qy 4140 GGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGG 4199 

I I I I II I I I II I I I I I I II I I I II I II I II I II I III III II I I II I 

Db 9872 GGC C AAG CAC C T C GC C TGAC GC AGAGTC C T T GT T CC GAGAAGC AC T C AGT AAC AAGGTGG 9931 

Qy 4200 CTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAG 4259 

III MM I II I I I I I I I II III II I II I I II I II II I I II II I II II I II 

Db 9932 ATG AGT T GGC T CAT TTTCTGCTCC GC AAGT AT C GAGC C AAGGAGC TGG TC AC AAAGGC AG 9991 

Qy 4260 AAATGC T GGAGAGTG TC AT C AAAAATT AC AAGC AC TGTTTTCCT GAGATC T T C GGC AAAG 4 319 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 9992 AAATGCTGGAGAGAGTCATCAAAAATTACAAGCGCTGCTTTCCTGTGATCTTCGGCAAAG 10051 

Qy 4320 CCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCC 4379 

I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I II II 

Db 10052 C C T C C GAGTC C C T GAAGAT GATC T T TGGC AT T GAC G TGAAGGAAGTGGAC CC C GC C AGC A 10111 

Qy 4380 ACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATC 4439 

II I I I I I I I I I I I I I I 1 I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10112 ACACCTACACCCTTGTCACCTGCCTGGGCCTTTCCTATGATGGCCTGCTGGGTAATAATC 10171 

Qy 4440 AGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCG 4499 

I II I I I I I I t I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I 
Db 10172 AGATCTTTCCCAAGACAGGCCTTCTGATAATCGTCCTGGGCACAATTGCAATGGAGGGCG 10231 

Qy 4 500 GCC ATGC TCC T GAGGAGGAAATCT GGGAGGAGC TGAGTGTGATGGAGGTGTATGAT GGGA 4 559 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 10232 AC AGC GC C TC T GAGGAGGAAATC T GGGAGGAGC TGGGTG TGAT GGGGG TGTAT GAT GGGA 10291 

Qy 4560 GGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAA 4619 

I I I I I I I I I II I I I I I I M I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 10292 GGGAGC AC AC T GTC TAT GG GGAGC C C AGGAAAC T GC T C AC C C AAGAT T GGGTGC AGGAAA 10351 

Qy 4 620 AGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGG 4 67 8 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I M I I I I I I I I I 

Db 10352 ACTACCTGGAGTACCGGCAGGTACCCGGCAGTAATCCTGCGCGCTATGAGTTCCTGTGGG 10411 

Qy 4 679 GTC CAAGGGCCCTCGCTGAAACC AGC TATGTGAAAGTCCTTGAGTATG TGAT CAAGGTCA 4738 

I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I I I I I I I I I Ml Mill III I I I I I 
Db 10412 GTCCAAGGGCTCTGGCTGAAACCAGCTATGTGAAAGTCCTGGAGCATGTGGTCAGGGTCA 10471 

Qy 4739 GT GC AAGAG TTCGCTTTTTCTTCC C ATC C C T GCGTGAAGC AGC T T T GAGAGAGGAGGAAG 4 7 98 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 10472 ATGCAAGAGT TCGC AT TGC C TAC C CATC CC TGCGTGAAGC AGC T TTGT TAGAGGAGGAAG 10531 

Qy 4799 AGG GAGT C T GAGC AT GAGT T GC AG C C AAGGC C AGT GGGAGGG GGAC T GGGC CAGT G 4854 

I I I I I I I I I I II I I I I I I I I I I II I I I III I I I I II II I I I I I I I I I I I 

Db 10532 AGGGAGTCTGAGCATGAGTTGCAGCCAGGGCTGTGGGGAAGGGGCAGGGCTGGGCCAGTG 10591 

Qy 4855 CACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTT 4914 

II II II III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10592 CATCTAACA — GCCCTGTGCAGCAGCTTCCCTTGCCTCGTGTAACATGAGGCCCATTCTT 1064 9 

Qy 4915 CACTC TGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGA 4970 

I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I III 

Db 10650 CACTCTGTTTGAAGAAAATAGTCAGTGTTCTTAGTAGTGGGTTTCTATTTTGTTGGATGA 10709 

Qy 4971 CTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGG 5030 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill II II I II I II I I I I 

Db 10710 CTTGGAGATTTATCTCTGTTTCCTTTTACAATTGTTGAAATG-TTCCTTTTAATGGATGG 107 68 

Qy 5031 T T GAATGAAC T T C AGC AT C C AAGT T TAT GAAT GAC AGC AG T C AC AC AG T T C T GTGT AT AT 5090 

II I I I I II II I M I II II II I II I II II I I I II I I I I I I I I I I II 

Db 10769 T TGAAT T AAC T T C AG C ATCC AAGT T TAT GAAT C GT AGT TAAC G TAT AT T GC T GT TAAT AT 10828 

Qy 5091 AGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAA 5150 

I II I II I II I I I II II I I II II I II I I I I I I I I II II II I I I I I II I I I I II I I II 

Db 1082 9 AGTTTAGGAGTAAGAGTCTTGTTTTTTATTCAGATTGGGAAATCCGTTCTATTTTGTGAA 10888 

Qy 5151 TTGGG AT AAT AAC AGC AG TGGAAT AAGTAC T TAGAAAT GT GAAAAAT GAGC AGT AAA 5207 

II I I I II I II I I I I I I II II I II I I I I I II II I M II III I I I II 
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Db 10889 T T TGGGACATAATAACAGC AGTGGAGTAAGTATT TAGAAGTGTG AATTCACCGTGAA 10945 

Qy 5208 ATAGATGAGATAAAGAAC TAAAGAAATT AAGAGATAGTC AATTC TTGC C TTATACC TCAG 5267 

Nil I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10946 ATAGGTGAGAT AAAT T AAAAGAT AC T T AAT T C C C GC C T T ATGC C TCAG 10993 

Qy 5268 T C TAT T C TGT AAAAT T T T T AAAGAT AT ATGC ATAC C T GGAT TTCCTTGGCTTCT T TGAGA 5327 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
Db 10994 TCTATTCTGTAAAATTTAAAAATATATATGCATACCTGGATTTCCTTGGCTTC GTGA 11050 

Qy 5328 AT G TAAGAGAAAT TAAATC T GAAT AAAGAAT T C T T C C TGT TC AC TGGC TCTTTTCTTCTC 5387 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 11051 ATG TAAGAGAAAT TAAATC TGAATAAAT AATT C T TT C TGT TAAC TGGC TCAT TTC TTC TC 11110 

Qy 5388 CATGCACTGAGCATCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAA 5447 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III I I I I I 
Db 11111 TATGCACTGAGCATCTGCTCTGTGGAAGGCCCAGGATTAGTAGTGGAGATACTAGGGTAA 11170 

Qy 5448 GC C AGAC T CAT AC CC AC C C AT AGGGT C G T AGAGT C T AGGAGC T GC AGT C AC G TAATC GAG 5507 

I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I II 

Db 11171 GC C AGAC AC AC AC C T AC CG AT AGGGTAT T AAGAGT C TAGG AGC GCGGT C ATAT AAT T AAG 11230 

Qy 5508 GTGGCAAGATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCT 5567 

III I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 

Db 11231 GTGACAAGATGTCCTCTAAGATGTAGGGGAAAAGT AACGAGTGTGGGTATGGGGCT 11286 

Qy 5568 CCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAAC 5627 

II I I I I I I I I I I I I I I I I I III I I I I I I MINI I I I I I I I I I I I I I I I I I I 

Db 11287 CCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGTG-TGGGGCCTTTTGGGCTTTGGGAAAC 1134 5 

Qy 5628 TGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 11346 TGCATTTTCTTCTGAGGGATCTGATTCTAATGAAGCTTGGTGGGTCC 11392 
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ORIGIN 


Location/Qualifiers 
1. .11495 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/isolate="patient MZ2 " 

/db_xref="taxon:9606" 

/ chr omo s ome= " X " 

/sex="female" 

/cell_type=" lymphocyte" 

/tissue_type= "blood" 

/ dev_s tage= " adult " 

450. .510 

/note="exon 1-1" 

836. .937 

/note="exon 1-2" 

1418. .1556 

/note="exon 1-3" 

2108. .2246 

/note="exon 1-4" 

2836. .2928 

/note="exon 1-5" 

3508. .3607 

/note="exon 1-6" 

4906. .4963 

/note="exon 1-7" 

5519. .5648 

/note="exon 1-8" 

9377. .9448 

/number=2 

9524. .11091 

/number =3 

9589. .10542 

/gene="MAGE4a" 

9589. .10542 

/gene="MAGE4a" 

/ codon_start=l 

/product="MAGE-4a antigen" 

/pr o t ein_id= "AAA688 71.1" 

/db_xref="GI : 533515" 

/translation="MSSEQKSQHCKPEEGVEAQEEALGLVGAQAPTTEEQEAAVSSSS 

PLVPGTLEEVPAAESAGPPQSPQGASALPTTISFTCWRQPNEGSSSQEEEGPSTSPDA 

ESLFREALSNKVDELAHFLLRKYRAKELVTKAEMLERVIKNYKRCFPVIFGKASESLK 

MI FGIDVKEVDPASNTYTLVTCLGLSYDGLLGNNQIFPKTGLLIIVLGTIAMEGDSAS 

EEEIWEELGVMGVYDGREHTVYGEPRKLLTQDWVQENYLEYRQVPGSNPARYEFLWGP 

RALAETSYVKVLEHWRVNARVRIAYPSLREAALLEEEEGV" 

11072. .11077 

11091 


Query Match 46.8%; Score 2655; DB 5; Length 11495; 

Best Local Similarity 73.6%; Pred. No. 0; 

Matches 4231; Conservative 0; Mismatches 1100; Indels 416; Gaps 


50; 


Qy 

Db 


21 CCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCCATCCAAACATCTTCACGCTC 80 
I I I I I I I I I I I I I I II I I I I I I I I 

5969 CCAGCACCCCTATCCTCCCCAAACCCCCACTACCCTTATGTCCTCATCCCCCACCCCAAC 6028 


Qy 81 ACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTGCTCTCAACCCAGGGAAGC-C 139 

II I I I I I I I I E I I I I I I I I I I I I I I I II I I I I I I I I I II II I I I 

Db 6029 ACCACTATCCCCATCCAGGTTGAATCGCATTCCGTTTCTGCTTTCAACCCAGGGAAGCTC 6088 


http://es/ScoreAccessWeb/GetItem.action?AppId=08819669&seqId=609516&Item 8/30/06 


Qy 140 CAGGTGC C C AGATGTGAC GC C AC T GAC T TGAGC AT T AG TGGT TAGAGAGAAGCGAGGT T T 199 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II 

Db 6089 CAGGTTCCTGGATGTGATGCCAGTGACTTGTGCATTGGGGGTTAGAGAGACGCTAGCTTC 6148 

Qy 200 TCGG TC T GAGGGGC GGC T T GAGAT C GGT GGAGGGAAGC GGGC CCA- GC T C T GTAAGGAGG 258 

II I.I I I I I III I I I I I III II I I I I I I I I I II III I I I I I I I III II 

Db 6149 TC AG TC T GAC AGGC AGC T T GGGAT T GGC AGAGGGAAGC CGG T C C AGGC T C TG TGAGGTGG 6208 

Qy 259 C AAGGTGAC AT GC TG AGGG AGGAC T GAGGACCCACTTACCCCAGATAGAGGACCCCA 315 

II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I II I I I I 

Db 6209 CATAGTGAGAAGC TGAGGGAGAAGTCGGGAGGC CC TC TCC ACCC CAGATAGACGAC CCCA 6268 

Qy 316 AATAATCC CTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTCTCAGGC 366 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 62 69 AATAATCCGGCACCCCTCCTGCTTCCAGTCCTGGGCCACCCGTGGGCGGACTTCTGAGTC 6328 

Qy 367 TGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAGCTCCGT 426 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 632 9 TGGGACGCCCACCACCCCACTGCCGCTGAAGCCGCAGGGACTATGGAGTCAGAGCTTGGT 6388 

Qy 427 GTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACATCATGCT 48 6 

I I I I M I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I 

Db 6389 GTGATCAGTGC AGGAC TGGTGGGGGT AGGCTCTGCCAGGCATCAACGT 6436 

Qy 487 C AGGAT T C TC AAGGAGGGC T GAGGGTC C C T AAGAC C C C AC TC C C GT GAC C C AACC C C C AC 546 

II I I I II I I I I I I I I I I I I I I I I I I I I II III I I I I 

Db 64 37 C AGGAC C C T AGGAGAGGGC T GAGT GT C C CC C A CCCCCATTCCTATCCCCTACCCCTT 64 93 

Qy 54 7 TCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCACCCCAC 606 

I I I I I I I I I I I I III I I I I I 

Db 6494 TCCCATCTGCACTCCC TACCCCATCTGTACCCCC 6527 

Qy 607 ATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCTCACCCC 666 

I I I I I I II I III III II II I I I II I III I MM 

Db 6528 ATTCCCCACCTGTGCCCCTATCCTCCCCAACCCCCCAACCAGCCTCATACCCCCCTCCCC 6587 

Qy 667 CACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCG-GTTCCCGCCAGG 725 

I I I I I I I II II I I I I I I II I II III I I I I I 

Db 6588 CACCCCTACCTTCATCCCCATCAGTGCAGCATCCGGTTCCACCCCTGCTTTCAATCCAGG 664 7 

Qy 726 AAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGAGAAGC 785 

II I I I I II I II II II I II I I I II I II I II I I MM III II II II I M 

Db 6648 C AAGC C C T GGG T GGC C GG AT GT GAT GC C AC T GAC T T GT G AAT T G AGGG T T AG AGAG AAGT 6707 

Qy 786 GAGGT T T C C AT TC TGAGGGAC GGC GT AGAGT T C GGC C GAAGGAAC C T GACC C AGGC TC T G 845 

I II II II I I I M II I I I I I I II I I I I I M I II II I IE I I I I I 

Db 6708 GAGTTTCTGGGTCTGAAGGGTGGC-TTGAGATCGGCAGAGGGAAGGTGGCCCAGGCTTTG 67 66 

Qy 846 TGAGGAGGCAAGGTGAGAGGC TGAGGGAGGAC TGAGGACC CC GC C ACT CCAAATAGAGAG 905 

IE I II I II II II II II I II I II I I II I I M II I I I I II II II II I 

Db 67 67 T GAAGAGGC AAAGTGAGAC T C TGAGGGAGGAT TC AGGAAAC C CC TAT C CC TG ATAG AGGG 6826 

Qy 906 CCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGACGTCT 965 

I I I I I III I I I II I M II I 

Db 6827 TCCCAGCCCTGGACTACCC C GC GG AGGC T GAC T T C T 68 62 

Qy 966 CAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTCTTCTC 1025 

I M II I II II M I II I II I II II I II 

Db 6863 CAGACTGGGCTGCTCCCCACCTCCGCCCCC TTCGCAACGCGTTTGTTTAAGCCAC 6917 

Qy 1026 CCCAAGCTCTGGAATCAGAGGTTGCTGTGACCAGGGCAGGACTGGTTAGGAGAGGGCAGG 1085 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 

Db 6918 AGGGGAC TC TGGAG T CAGAGGT TGGTGT GATC AGGGAAGGGC T GGT TAGGAGA- GGC AT G 6976 

Qy 108 6 GCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCCCCAAG 114 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I II II I I I I I I I I 

Db 6977 GC C C AGG C C C T GC C AGGAAT CAAAGT C AGAAAC C - TGAGAGGGAAC T GAGG T C C CC C AAG 7035 

Qy 1146 ACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACCCCCAT 1205 

I I II II I I I I I I I I I I I I 
Db 7036 ATCCTAGTCTAACCCCCACTCCCACAA 7062 

Qy 1206 CTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACCACCCT 1265 

I I I I III II I I I I I II I I I I I 

Db 7063 ATCCGCTGCCATTTCGCTGCTCCATTTCCCATTCCTTGCCCT 7104 

Qy 1266 CCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAACCCCAC 1325 

I I I I I I I I I 

Db 7105 CCACCCTCACCA 7116 

Qy 1326 CCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCCGGTTT 1385 

I I I I I I I I I I II I 

Db 7117 GGC AG AAT C C AGT T C 7131 

Qy 1386 GCC-CCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACTTGAA 1444 

II I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 7132 CCCTTCTGCTATCAATCCAGGGAAACCCCAGGCTTGGTGCTGGGATGTTTTT 7183 

Qy 1445 C C TC AC AGAT C T GAGAGAAGC C AGGT T C AT T T AAT GGT TC TGAGGGGC GGC T T GAGAT C C 1504 

II I I I I II I I I I I I I I I I I I I I I I I I I 

Db 7184 TGGGGGT C AGAGAAT C AAGGGC AT AGT C C T GAGGGGC C AGT T GAGAT C G 7232 

Qy 1505 AC T GAGGGGAG T GG T TT T AGGC T C T GT GAGGAGGC AAGGT GAGATGC T GAGGGAGG AC T G 1564 

I I I I I I I I I I II I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 72 33 GC T GAGGGGAG C GGGCC C AAGC TC T GT GGC GAGGC AAGGT GAGAC TC T GAGGAAGGAC T G 72 92 

Qy 1565 AGG AGGC AC AC AC C C CAGG TAGAT GGC C CC AAAAT GAT C C AGTAC C AC C C C T GC TGCC AG 1624 

I I I I I I I I I I I I I II I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
Db 72 93 AGGAGGCCCCCACCCAAGATAGA-GGAACCCAAATAATCCAGCGCAGCTCCTGCTGCCAG 7 351 

Qy 1625 CCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCCCACT 1684 

I I I I I I I I I I I I I I II III I I I I I III II I I I I I I I I 

Db 7352 TCCTGGACCACCCGG GGGAAGACTTCTCA GGCTAGGCCATCCCAGCTCCCACT 7404 

Qy 1685 GCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTTGGTC 1744 

I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 7405 GC C AC TAAAGC T AC AGGGGAC T C T AGAG TC AAGAGC T T GG TGT GC C CA 7452 

Qy 1745 AGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGGACCC 1804 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7453 AGGC AGGGCCC AGGC TCTGCCTGGCATCGGGGTCAGGACCT 74 93 

Qy 1805 TGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACCCCAC 1864 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

Db 7494 T GAGAGG GAAC T GAG GGC GC T AC AC CC C C ACC C CAT C C GC AT T C CAACAT 7543 

Qy 1865 TCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTGTCAA 1924 

III I I I I I I I I I I I II II III I I I I I I I I I I I 

Db 7544 GCCCAGCCCCATCCCCAACTCCGTTTTGCAGAATCCATTTTT TCCCC TGCAGTC AA 7599 

Qy 1925 CCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCAGGGT 1984 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
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Db 7600 C C C CGGGAAGAC C T GGGAATGGT C AGGC AC TC GGAT C T TGAC AT CC AC ATC GAGGGC 7 656 

Qy 1985 CTGATGGAGGGAAGGGG C T T GAAC AGGGC C T C AGGGGAGC AGAGGGAG 2032 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7657 TGAAGGAGGGAGAGGGT T T GG TAT C ATGAGC AGAGC C TC AGGGT AGC AGAGG GAGGAC C C 7716 

Qy 2033 - GGC C C T AC T GC GAGAT G AGGG AGGC C T C AGAGG AC C C AGC AC C C TAGGAC 2082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 7717 TGGCCCTCC T GGGAG ATGAGGAAGGC C T C AGGAGAC C C AGC AC C CC AAGGC AGGGAGC C C 7776 

Qy 2083 AC C GC AC C C C T GTC TGAGAC TGAG - - GC TGC C AC TTCTGGCCT C AAGAATC AGAACGAT G 2140 

I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 7777 ACCCCACCCCTGTCTGAGAATGAGGTGCCTCCTCTTTTAGCCTCAGGAATCCAAGGGATG 7836 

Qy 2141 GGG AC TC AGAT T GC AT — GGGGG T GGGAC C C AGGC C TGC AAGGC T T ACGC GGAGGAAGAG 2198 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I 

Db 7837 GC AAC TC AGGT C AGC AGAGGGGTGGGT T C C AAGC C C T T C C AGGATCAAGGAAAGGAAGAC 7896 

Qy 2199 GAGGGAG GAC T C AGGGGAC C T T GGAAT C C AGATC AG TGTGGAC C TC GGC C C T GAGAGGT C 2258 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7897 GAGGGAGGAT T C AGGGGGC C T T GC AT T C C AGATC AG TGGAGAC C TGGGC C C T GGGAGGT C 7956 

Qy 2259 C AGGGC ACGGT GGCC ACAT ATGGCCC AT AT TTCC TGC ATC TTTG AGGT GACAGGAC 2314 

I I I I I I III I I I I I I I II I I I I I I I I I I I I II I I I I I I I II I I I I 

Db 7957 C T GGGC AAGGT AGC C ACC T GTAGC T CAT AC TTCC T GC ATC T T C G AGGT C AC AGAGAGGAG 8016 

Qy 2315 AGAGC TG TGGT C T GAGAAG TGGGGC C TC AGG T C AAC AGAG GGAG GAGT T C C AGGATC C AT 2374 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8017 AGGGC TATGGTCTGAGGGGTGGTACTTCAGGTCCGCAGAGGGAGGAGTCCCAGGATCTAC 807 6 

Qy 2375 ATGGCCCAAGATGTGCC-CCCTTCATGAGGACTGGGGATATCCCCGGCTCAGAAAGAAGG 2433 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I II 
Db 8077 AGGAC C C AAGG TG TGC C AC AC T TC AC GAGGAATGGGGATAC C T G TGGC T C AGAAAGAC GG 8136 

Qy 24 34 GACTCCACACAGTCTGGCTGTCCCCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGG 24 93 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8137 GACCCCACAGAGTCTGGCTGTCCCCTGTTCTTAGCTCAGGGGGGACCAGAGGAGGGATGG 8196 

Qy 24 94 C GG TATG T TC C AT T C T C AC T T GTAC CAC AGGC AGGAAGT T GGGG GGC C C T CAGGGAGAT G 2553 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II II I I I I I 
Db 8197 C C C TAT G TGC C AAT T T CAC T T GT T C CAC AGGC AGGAAGT T GGGGAAC C T T CAGGGAGAT G 8256 

Qy 2554 GGGTC T T GGGG TAAAGGGGGGATGTCT AC T CAT GTC AGGG AAT T GGGGGT TGAGGAAGCA 2 613 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
Db 8257 AGGTTTTGGAGTAAAGGGGCAATGTTTGCTCATCTCAGGGGGTTGGGGGTTGAGGAAGGG 8316 

Qy 2614 CAGGCGC TGGC AGGAATAAAGATGAGTGAGACAGAC AAGGC TAT TGGAATCCACACCCCA 2673 

I I I I I I IE I II I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 
Db 8317 C AGGC C C T GTC AGGAGC AAACATGAGT - AC C C AC AGGAGGC C ATC AGAAC C C T C ACC C C A 8375 

Qy 2674 GAACCAAAGGGGTCAGCCCTGGACACCTCACCCAG GATGTGGCTTCTTTTTC 2725 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8376 GAACCAAAGGGGTCAGCCC TGGGC ACCCCACACAGGGGTGACAGGATGTGGCTCCTTCTC 8435 

Qy 2726 AC TCCTGTTTC C AGATC TGGGGCAGGT GAGGAC C T C AT T C T CAGAGGGTGAC TC AGGT C A 2785 

I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8436 AT T TC T GAT T C C AGATC TCAGTGAGGT GAGGAC C T T GT T C T CAGAGGGTGAC TC AGGT C A 8495 

Qy 278 6 ACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCGGTCCCAGGATCTGCCATGCGTTCGG 2845 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I II I I I I I II I I 
Db 8496 CCACAGGGACCCCCATCTGGTCTACAGACACAGTGGTCCCAGGATCTGCCAAGAGTCCTG 8555 
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Qy 2846 GTGAGGAAC ATGAGGGAGGAC T GAGGGT AC C C C AGGAC C AGAAC AC TG AGGGAGAC T GC A 2905 

I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I MM M M M I I I I I Ml M 
Db 8556 GTGAGGAATGTGAGGGAGGAT T GAGGGT AC C ACAGGGC C AGAAC GC AGATGAT GAC C C C A 8615 

Qy 2906 CAGAAATCAGCCCTGCCCCTGCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAG 2 965 

M M M I M M M M I MM M M M M M I M M M M M I I Ml M M I Ml 

Db 8616 C AGAAAT C AGC CCTGCTCC TGT TG TC AC C C C AGAGAGC AT GGGC T TGG CTTTCTGCT GAG 867 5 

Qy 2966 GTCCTTCCGTTATCCTGGGATCATTGATGTCAGGGACGGGGAGGCCTTGGTCTGAGAAGG 302 5 

I I II M I I M I I II II I I II II I I II I III I I I II I II II I I I I I II I II 

Db 867 6 GTCCCTCTCTTATCCTGGGATCACTGGTGTCACGGAGTGGGAGGCCTTGGTCTGAGGGGG 8735 

Qy 302 6 C T GC GC T C AGG T C AG T AGAGGGAGC GTC C C AGGC C C T GC C AGGAGTC AAGGT GAGGAC C A 3085 

MM I I I II II I I II II I I I II II I I II I I I I II I I II I I II I M I I I I I I I I I 
Db 8736 C T GC ACC C AGGT C AG T AGAGGGAGGGTC C C AGGC T C T GC C AGGAGT T GAGGT GAGGACC A 8795 

Qy 308 6 AGC GGGC AC C T C AC C C AGGAC AC AT T AAT TC C AAT GAAT T T TGATAT C T C T T GC T G C C C T 314 5 

III III II II I II II II I II I II I I I I I II I II I II I I I I I I II I I I I 
Db 87 96 AGC AGGC TCCGCATCC AGGAC AC ATGGGTTCCAATGAATTTCGACATCTTTTGCTGTCGT 8855 

Qy 314 6 TC-CCCAAGGACCTAGGCACGTGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCT 3204 

II I I II I II I I II I I I II I I I I I II II I II II I I I I I I I 

Db 8856 TCTTCGGAAGACCTAGGCACAGGTGGCCAGATGTGGGGTTTCTTAGGTCCT GTTCCC 8 912 

Qy 3205 TATCATGGATGTGAACTC T TGAT T TGGAT T TC TCAGACCAGCAAAAGGGCAGGATC CAGG 32 64 

I III I I I I I I I I II II I I I II I I II I II I II I II I I I I I I I II I I II I I 
Db 8913 TC T C AGGC ATGT GAG C T C T T GAT C TGAG T T TC T C AGGC C AGC AAAAGAGT GG GAT C CAGG 8972 

Qy 3265 CC C T GCC AGGAAAAATATAAGGGC C C T GC GTGAGAAC AGAGGGGGTC AT C C AC T GC AT GA 3324 

I I I II II Ml I I I I I I II II I I II I II I I I I I I II I II I II I I II II II I 

Db 8973 CCCTGCCTGGAGAAATGTGAGGGCCCTGAGTGAACACAGTGGGGATCATCCACTCCATGA 9032 

Qy 3325 GAG T GGGGAT G T C AC AGAG T CC AGC CC AC C C T C C T GGTAGC AC T GAGAAGC C AGGGC TGT 3384 

II I I II I II I M I II I I I I II II I I II I I I II I M I II I I I II I I I II I I 

Db 9033 GAG T GGGGAC C T C AC AGAG T CC AGC C T AC C C T C T T GATGGC AC T GAGG GAC C GGGG C T G T 9092 

Qy 3385 GCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCAGGAACCAGG 3444 

I II I I I II I I I II I I I II I II I I I I I II II I II I I I I I II II I I I II I I III 

Db 9093 GC T T AC AG T C T GC AC CC T AAGGGC C CAT GGAT TCCTCTCC TAGGAGC T C C AGGAAC AAGG 9152 

Qy '34 4 5 CAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTCACAGAGCAGAGGATGCACAGGGTG 3504 

II I II II I II I I II I II II I I II II I I II I I I I I I I I I I I I I I I I I II II I I II I II 

Db 9153 C AGTGAG GC C T TGGT C T GAGACAG T GT C C TC AGG T T AC AGAGC AGAGG AT GC AC AGGC TG 9212 

Qy 3505 TGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAGGACACA 35 64 

II I I I I I I I I I I M I I M I I II I I I II I II I I II I M I II I I I II II I II I I I I I II I I 

Db 9213 TGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAAGACACA 9272 

Qy 3565 TAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAATCGACCTCTG 3624 

II I II II I I I II I I I II II II I I I I I I II II II III II II I II I I I I II I I II II 
Db 9273 TAGGACTCCAAAGAGTCTGGCCTCACCTCCCTACCATCAATCCTGCAGAATCGACCTCTG 9332 

Qy 3625 CTGGCCGGCTGTACCCTGA-GTACCCTCTCACTTCCTCCTTCAGGTTTTCAGGGGACAGG 3 683 

II I I I IE I I I I I I I I II I II I I I I I I II I I I II I II II I I I I I I II I II I I I 
Db 9333 CTGGCCGGCTATACCCTGAGGTGCTCTCTCACTTCCTCCTTCAGGTTCTGAGCAGACAGG 9392 

Qy 3684 C C AAC CC AGAG GAC AGGAT TC C C T GGAGGC C AC AGAGGAGC AC C AAGG AGAAGATC T GT A 3743 

I I II II II I I I II II I I I II II II II II II I II I II I I I II I II II I II II I I I I II I 
Db 9393 C C AAC C G - GAGGAC AGG AT TC C C T GGAGGCC AC AGAGGAGC AC C AAGGAGAAGAT C TGTA 9451 
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Qy 3744 AGT AGGC C T T T GT TAGAGT C T C C AAGGT T C AG T TC T C AGC T GAGGC C T C T C AC AC AC TC C 3803 

I I I I I I I I I I I I I I I I I III III II I I I I I I I I I I I I I I I I I I I I I I 1 I I I 
Db 94 52 AGTAAGCCTTTGTTAGAGCCTCTAAGATTTGGTTCTCAGCTGAGGTCTCTCACATGCTCC 9511 

Qy 3804 CTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTG 38 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIMI 
Db 9512 CTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCCAGCTTTTGCCTGCACTCTTGCCTGCTG 9571 

Qy 38 64 CCC TGACGAGAGTCATCATGTCTC TTGAGCAGAGGAGTCTGCAC TGCAAGCC TGAGGAAG 3923 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 9572 CCC TGAC C AGAGTC ATCAT G T C T T C TGAGC AGAAGAGTC AGC AC TGC AAGC C T GAGGAAG 9631 

Qy 3924 CCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I III I I I I I I I II 
Db 9632 GC G T T GAGGC C C AAGAAGAGGC CC T GGGC C TGGTGG GT GC AC AG GC T C C TAC T AC TGAGG 9691 

Qy 397 6 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGC 4 019 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9692 AGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTCTGGTCCCTGGCACCCTGGAGGAAGTGC 9751 

Qy 4020 CCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTA 4079 

I I I I I I I I I I I Ell I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 97 52 C T GC TGC T GAG TC AGC AGG T C C TC C C C AGAGT CC T C AGGGAGC C TC T G C C T TAC C C AC T A 9811 

Qy 4080 C CATC AAC T TC AC TCGAC AGAGGC AAC C C AGT GAGGGT T C C AGC AGC C GT GAAGAGGAGG 4139 

I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9812 CCATCAGCTTCACTTGCTGGAGGCAACCCAATGAGGGTTCCAGCAGCCAAGAAGAGGAGG 9871 

Qy 4140 GGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGG 4199 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9872 GGC C AAGC AC C T C GC C T GAC GC AGAGT C CTTGTTCC GAGAAGC AC T C AGT AAC AAGGT GG 9931 

Qy 4200 CTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAG 4259 

III I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9932 ATGAGTTGGCTCATTTTCTGCTCCGCAAGTATCGAGCCAAGGAGCTGGTCACAAAGGCAG 9991 

Qy 4260 AAATGC T GGAG AGT GTC AT C AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAG 4319 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 
Db 9992 AAATGC T GGAG AGAGTC AT C AAAAAT T ACAAGC GC TGCTTTCCT GTGAT C T T C GGC AAAG 10051 

Qy 4320 C C T C TGAGT C C T T GC AGC T GGT C T T TGGC AT T GAC G T GAAGGAAGCAG AC C C C AC C GGC C 4379 

I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II 

Db 10052 C C T CCGAGT C C C T GAAGAT GAT C T T TGGC AT T GAC G TGAAGGAAGT GG AC CC C GC C AGC A 10111 

Qy 4380 ACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATC 4439 

II I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10112 ACACCTACACCCTTGTCACCTGCCTGGGCCTTTCCTATGATGGCCTGCTGGGTAATAATC 10171 

Qy 4440 AGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCG 4 4 99 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I 
Db 10172 AGATCTTTCCCAAGACAGGCCTTCTGATAATCGTCCTGGGCACAATTGCAATGGAGGGCG 10231 

Qy 4500 GC C AT GC T C C T GAGGAGGAAATC T GGGAGGAGC TGAGT GT GAT GGAGGTG TAT GAT GGGA 4559 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10232 ACAGCGCCTCTGAGGAGGAAATCTGGGAGGAGCTGGGTGTGATGGGGGTGTATGATGGGA 10291 

Qy 4560 GGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAA 4 619 

MINIMI || I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 
Db 10292 GGGAGCACAC T GTC TATGGGGAGC CCAGGAAAC TGC TCAC CCAAGATTGGGT GCAGGAAA 10351 

Qy 4620 AGT AC C T GGAG TA- C GGCAGG TGCC GGAC AG T GAT CCCGCACGC TAT GAGT T C C T G TGGG 467 8 
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I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 10352 ACTACCTGGAGTACCGGCAGGTACCCGGCAGTAATCCTGCGCGCTATGAGTTCCTGTGGG 10411 

Qy 4 679 GTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCA 4 738 

I I I I I I I I I I II I I I 1 I I I I I I I I I II I I I I I I I I I I I III I I II I I I I I I I II 
Db 10412 GTCCAAGGGCTCTGGCTGAAACCAGCTATGTGAAAGTCCTGGAGCATGTGGTCAGGGTCA 10471 

Qy 4739 GTGCAAGAGT TCGCTTTTTCTTCC C ATC CC TGC GTGAAGC AGC T T T GAGAGAGGAGGAAG 4798 

I I I I I I I I I I I I I II II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 10472 ATGC AAGAGT T C GC AT TGC C T AC C C ATC CC TGC G TGAAGC AGC T T T G T T AGAGGAGGAAG 10531 

Qy 4799 AGGGAGT C T GAGC AT GAGT T GC AGCC AAGGC C AGTGGGAGGG GGACTGGGCCAGTG 4854 

I I I I I I I I I I I I I I I I I I I I I I II I I I III I II I II II I I I I I I I I I I I 

Db 10532 AGGGAGTC TGAGCAT GAGT TGC AGCCAGGGCTGTGGGGAAGGGGCAGGGCTGGGCCAGTG 10591 

Qy 4 855 CACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTT 4 914 

III! II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10592 CATCTAACA — GCCCTGTGCAGCAGCTTCCCTTGCCTCGTGTAACATGAGGCCCATTCTT 1064 9 

Qy 4915 CACTC TGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGA 4970 

I I I I I Mllll I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I III 

Db 10650 CACTCTGTTTGAAGAAAATAGTCAGTGTTCTTAGTAGTGGGTTTCTATTTTGTTGGATGA 10709 

Qy 4 971 CTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGG 5030 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 10710 CTTGGAGATTTATCTCTGTTTCCTTTTACAATTGTTGAAATG-TTCCTTTTAATGGATGG 107 68 

Qy 5031 T TGAATGAAC T TC AGC AT C C AAGT T TAT GAATGAC AGC AG TC AC AC AG T T C T GT GT AT AT 5090 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 10769 T TGAAT TAAC T TCAGCATC CAAGT T TAT GAATCGTAGTTAACGT ATAT TGC T GT TAATAT 10828 

Qy 5091 AGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAA 5150 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10829 AGT T TAGGAGT AAGAGT C TTGTTTTT T ATT C AGAT T GGGAAAT C C GT T C TAT T T T G T GAA 10888 

Qy 5151 TTGGG AT AAT AAC AGC AG T GGAAT AAGT AC T T AGAAAT GTGAAAAAT GAGC AGT AAA 5207 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10889 T TT GGGACATAATAACAGC AGTGGAGTAAGTAT T TAGAAG TGTG AATTCACCGTGAA 10945 

Qy 5208 ATAGATGAGAT AAAGAAC TAAAGAAATTAAGAGATAGTCAAT TC TTGC C T TATACC TCAG 52 67 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I 

Db 1094 6 ATAGGT GAGAT AAAT T AAAAGAT AC T T AAT T C CC GC C T T AT GC C TCAG 10993 

Qy 5268 TC TAT TC TGTAAAAT T T T TAAAGATATATGCATACC TGGATT TCC T TGGC T T C T T T GAGA 5327 

I I I I I I I I I I I I I I I I I III I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 
Db 10994 T C TAT T C T GT AAAAT T T AAAAAT AT AT ATGC AT AC C T GGAT TTCCTTGGCTTC GTGA 11050 

Qy 5328 ATGTAAGAGAAATTAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTC 5387 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIMI 
Db 11051 ATGTAAGAGAAATTAAATCTGAATAAATAATTCTTTCTGTTAACTGGCTCATTTCTTCTC 11110 

Qy 5388 CATGCACTGAGCATCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAA 5447 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I Ml I I I I I 
Db 11111 TAT GC AC T GAGC ATC TGCTCTGTGGAAGGCCCAGGATTAGTAGTGGAGATAC TAGGGTAA 11170 

Qy 5448 GC C AGAC TC AT AC CC AC C C AT AGGGTC G T AGAGT C T AGGAGC TGC AGT C AC G TAAT C GAG 5507 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 

Db 11171 GC C AGAC AC AC AC C T AC C G AT AGGGT AT T AAGAGTC TAGGAGC G C GGT C ATAT AAT T AAG 11230 

Qy 5508 GT GGC AAGAT G T C C T C TAAAGATGT AGGGAAAAGTGAGAG AGGGG T GAGGG T GT GGGGC T 5567 

III I I I I I I I I I I I I I I I I I I II I I I I I I III I I I I I I I I I I I 
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Db 11231 GTGACAAGATGTCCTCTAAGATGTAGGGGAAAAGT AACGAGTGTGGGTATGGGGCT 11286 

Qy 5568 CCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAAC 5627 

II I I I I I I I I I I I I I I I I I III I I II I I I I I 1 I I I I I I I I I I I I I I I I I I I I 
Db 11287 CCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGTG-TGGGGCCTTTTGGGCTTTGGGAAAC 11345 

Qy 5628 TGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I II I I I I I I I I I I I I I I I I I I II II I I I I II III 
Db 11346 TGCATTTTCTTCTGAGGGATCTGATTCTAATGAAGCTTGGTGGGTCC 11392 
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U82696 161664 bp DNA linear PRI 31-DEC-2002 

Homo sapiens chromosome X clone ICRFXcl04-F064 , ICRFXcl04-G0799 , 
QC-14E2, QC-13D8, QC-7G11, ICRFXcl04-E0681 , QC-11C8, Qc-9A9 map 
q28, complete sequence. 
U82696 

U82696.2 GI:27436770 
HTG. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae ; Homo . 

1 (bases 1 to 161664) 
Galgoczy, P., Wen, G. and Platzer,M. 
Chromosome X genomic sequence 
Unpublished 

2 (bases 1 to 161664) 

Gloeckner , G . , Rosenthal, A. , Drescher,B., Schattevoy, R . , Hinzmann,B. 
and Poustka,A. 
Direct Submission 

Submitted ( 19-DEC-1996) Genome Analysis, Institut for Molecular 
Biotechnology, Beutenbergstrasse 11, Jena 07745, Germany 

3 (bases 1 to 161664) 
Platzer , M. 

Direct Submission 

Submitted ( 31-DEC-2002 ) Genome Analysis, Institute of Molecular 
Biotechnology, Beutenbergstr . 11, Jena, Thuringia 0774 5, Germany 
On Dec 31, 2002 this sequence version replaced gi: 2735037. 
Genome Center 

Center: Insitute of Molecular Biotechnology 

Center code: 1MB 

Web site: http://genome.imb-jena.de/ 
Contact : gsc j -submit@genome . imb- j ena . de 

Project Information 

Center project name: x81+ 

Center clone name: ICRFXcl04-F064 to Qc-9A9 

Summary Statistics 

Sequencing vector: M13 and pUC18; 100% of reads 
Chemistry: Dye- terminator Big Dye; 100% of reads 
Assembly program: Phrap; version 0.990329 
Consensus quality: 161664 bases at least Q40 
Consensus quality: 161664 bases at least Q30 
Consensus quality: 161664 bases at least Q20 
Quality coverage: 26.71x 


This sequence was finished as follows unless otherwise noted: all 
regions were double stranded, sequenced with an alternate 
chemistry, or covered by high quality data (i.e., phred quality >= 


http://es/ScoreAccessWeb/GetItem.action? Appld=088 1 9669&seqld=6095 1 6&ItemName=us. 


8/30/06 


30); an attempt was made to resolve all sequencing problems, such 
as compressions and repeats; all regions were covered by at least 
one plasmid subclone or more than one M13 subclone. 


Neighboring sequence information: 

This clone is overlapped by RP11-366F6, RP1-228J9, RP1-77B24, 
RP1-73F14 . 


Sequence Quality Assessment: 
This entry has been annotated with sequence quality 
estimates computed by the Phrap assembly program. 
All manually edited bases have been reduced to quality zero. 
Quality levels above 40 are expected to have less than 
1 error in 10,000 bp. 

Base-by-base quality values are not generally visible from the 
GenBank flat file format but are available as part 
of this entry's ASN.l file. 
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source 


source 


QC-13D8, 


1" 


Location/Qualifiers 
1. .161664 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9 606" 
/ chr omo s ome= " X " 
/map="q2 8" 

/clone="ICRFXcl04-F064, ICRFXcl04-G07 99 , QC-14E2, 
QC-7G11, ICRFXC104-E0681, QC-11C8, QC-9A9" 
1. .39145 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref ="taxon: 9606" 
/clone="ICRFXcl04-F064" 

/clone_lib="ICRF human X specific cosmid library no. 104" 
1. .46826 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db__xref ="taxon: 9606" 
/clone="RPl-228J9" 
/clone_lib="RPCI human PAC 
/note="overlapping clone" 
1. .144241 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9606" 
/clone="RPll-366F6" 
/clone_lib="RPCI human BAC 
/note="overlapping clone" 
15197. .60086 
/organism="Homo sapiens" 
/mo l_type=" genomic DNA" 
/db_xref="taxon:9606" 
/clone="ICRFXcl04-G0799" 

/clone_lib="ICRF human X specific cosmid library no. 104" 

47833. .85228 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref ="taxon: 9606" 

/clone="Qc-14E2_A" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 
51142. .89908 
/organism="Homo sapiens" 


11" 
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/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/clone="Qc-13D8" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 
source 79784. .117526 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/clone="Qc-7Gll" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 
source 83247. .161664 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref="taxon: 9606" 

/clone="RPl-77B24" 

/clone_lib="RPCI human PAC 1" 

/note="overlapping clone" 
source 90591. .127521 

/organism="Homo sapiens" 

/mol_type-" genomic DNA" 

/db_xref="taxon:9606" 

/clone="ICRFXcl04-E0681" 

/clone_lib="ICRF human X specific cosmid library no. 104" 
source 97402. .138230 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9606" 
/clone="Qc-HC8" 

/clone_lib="QIZ-derived Xq27.3-Xqter cosmid library" 
source 125957. .161664 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/clone="Qc-9A9" 

/clone_lib="QIZ-derived Xq27 . 3-Xqter cosmid library" 
source 153955. .161664 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref ="taxon: 9606" 

/clone="RPl-73F14" 

/clone_lib="RPCI human PAC 1" 

/note="overlapping clone" 
variation 114 

/note="C substituted in clone: RP11-366F6" 

/replace="a" 
variation 205 

/note="deleted in clone: RP1-228J9 , deleted in clone: 

ICRFXC104-F064" 

/replace=" " 
variation 355 

/note="T substituted in clone: RP11-366F6" 

/ replace="c" 
variation 403 

/note="T substituted in clone: RP11-366F6" 

/replace="g" 
misc_feature 485. .642 

/note="single stranded/single chemistry region" 
variation 601 

/note="T substituted in clone: RP11-366F6" 

/replace="c" 
variation 1040 
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/note="C substituted in clone: RP11-366F6" 

/replace="t" 
variation 1080 

/note="C substituted in clone: RP11-366F6" 

/replace="t" 
variation 1760 

/note="A substituted in clone: RP11-366F6" 

/replace="g" 
variation 2138 

/note="C substituted in clone: RP11-366F6" 

/replace="g" 
variation 2298 

/note="C substituted in clone: RP11-366F6" 

/replace="t" 
variation 2474. .2475 

/note="TT substituted in clone: RPll-366F6 f 

/replace="aa" 
variation 2515 

/note="G substituted in clone: RP11-366F6" 

/replace="a" 
variation 2531 

/note="C substituted in clone: RP11-366F6" 

/replace="t" 
variation 2691 

/note="A substituted in clone: RP11-366F6" 

/replace="g" 
variation 2808 

/note="C substituted in clone: RP11-366F6" 

/replace="t" 
variation 3334 


Query Match 46.8%; 
Best Local Similarity 73.6%; 
Matches 4231; Conservative 


Score 2654.8; DB 5; 
Pred. No. 0; 
0; Mismatches 1102; 


Length 161664; 
Indels 415; Gaps 


50; 


Qy 21 CCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCCATCCAAACATCTTCACGCTC 80 

I I I I I I I I I I I I I I I I I I I I I I I I 

Db 60227 CCAGCACCCCTATCCTCCCCAAACCCCCACTACCCTTATGTCCTCATCCCCCACCCCAAC 6028 6 

Qy 81 ACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTGCTCTCAACCCAGGGAAGC-C 13 9 

I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 60287 ACCACTATCCCCATCCAGGTTGAATCGCATTCCGTTTCTGCTTTCAACCCAGGGAAGCTC 6034 6 

Qy 140 C AGGT GC C C AGAT GTGAC GC C AC T GAC T TGAGC AT T AGTGGT TAGAGAGAAGCGAGGT T T 19 9 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II 
Db 60347 CAGGTTCCTGGATGTGATGCCAGTGACTTGTGCATTGGGGGTTAGAGAGACGCTAGCTTC 6040 6 

Qy 200 TCGGTCTGAGGGGCGGCTTGAGATCGGTGGAGGGAAGCGGGCCCA-GCTCTGTAAGGAGG 258 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 60407 TCAGTCTGACAGGCAGCTTGGGATTGGCAGAGGGAAGCCGGTCCAGGCTCTGTGAGGTGG 60466 

Qy 259 C AAGGTGACAT GC TGAGGGAGGAC T GAGGACCCAC T TACCC C AGAT AGAGGACC CCA 315 

II I I I I I I I I I I I I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I I 

Db 604 67 C AT AGT GAGAAGC TG AGGGAGAAG TCGGGAGGCCC T C T C C AC C C C AGAT AGAC GAC C C C A 6052 6 

Qy 316 AATAATCC CTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTCTCAGGC 366 

I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 60527 AATAATCCGGCACCCCTCCTGCTTCCAGTCCTGGGCCACCCGTGGGCGGACTTCTGAGTC 6058 6 

Qy 367 TGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTC-GAAGTCAGAGCTCCG 425 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


60587 TGGGACGCC C AC C AC C C C AC TGCC GCTG AAGC C GC AGGGG AC TAT GGAGT C AGAGC T T GG 6064 6 


426 


485 


TGT GATC AGGGAAGGGC TGC T TAGGAGAGGGC AGCG T C C AGGC T C TGC C AGAC ATC ATGC 
I I I I I I I I 1 I II I I I I I II I I I I I I I I I I I I I I I I I 

60647 TGT GATC AGTGC AGGAC TGGTGGGGGT AGGC TC TGC CAGGC ATC AACG 60694 


486 


545 


TCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAACCCCCA 

I I I I I I II I I I I I I I I I I I I I I I I I I I I II III I I I I 
60695 T C AGGAC C C TAGGAGAGGGC TGAG TGTCCCCCA CCCCCATTCCTATCCCCTACCCCT 607 51 


546 


605 


CTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCACCCCA 

I II I I I I I I I I I III I III 

60752 TTCCCATCTGCACTCCC TACCCCATCTGTACCCC 60785 


606 


665 


CATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCTCACCC 

I I I I I I I I I I ill III II II I I I I I I I I I I I I I 

6078 6 CATTCCCCACCTGTGCCCCTATCCTCCCCAACCCCCCAACCAGCCTCATACCCCCCTCCC 6084 5 


666 


724 


CCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCG-GTTCCCGCCAG 

I I I I I I I I I I II I I II II I II I II III I I I I 

6084 6 CCACCCCTACCTTCATCCCCATCAGCGCAGCATCCGGTTCCACCCCTGCTTTCAATCCAG 60905 


725 


784 


GAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGAGAAG 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
60906 GC AAGC C C T GGGT GGC C GG ATGTGATGC C AC T GAC T T GTGAAT T GAGGGT T AGAGAGAAG 60965 


785 


844 


C GAGGT T T C CAT T C T GAGGGAC GGC GT AGAGT TC GGC C GAAGGAAC C T GAC C CAGGC T C T 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

60966 TGAGTTTCTGGGTCTGAAGGGTGGC-TTGAGATCGGCAGAGGGAAGGTGGCCCAGGCTTT 61024 


845 


904 


GTGAGGAGGCAAGGT G AG AGGC TGAGGG AGGAC TGAGGAC CCCGCCAC TCCAAATAGAGA 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I 
61025 GTGAAGAGGCAAAGT GAGAC TC TGAGGGAGGAT TCAGGAAACCC C TAT CCC TGATAGAGG 61084 


905 


964 


GCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGACGTC 

I I I I I I II I I I I I I II I I I 
61085 GTCCCAGCCCTGGACTACCC C GC GGAGGC T GAC T T C 61120 

965 T C AGC C T GGGC T GC C C C CAGAC CC C TGC T C CAAAAGC C T T GAGAGAC ACC AGGT TC T TC T 1024 

II I I I I I I I I I I I I I I I I I I I I II I I 

61121 TCAGACTGGGCTGCTCCCCACCTCCGCCCCC TTCGCAACGCGTTTGTTTAAGCCA 6117 5 

1025 CCC C AAG C T C T GGAAT C AGAGGTT GC TG TGAC CAGGGC AGGAC T GGT T AGGAGAGG GC AG 1084 
I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I II I I I I II I I I I I I 

61176 CAGGGGACTCTGGAGTCAGAGGTTGGTGTGATCAGGGAAGGGCT GGT TAGGAGAGGGC AT 61235 

1085 GGCACAGGCTC TGCC AGGC ATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCCCCAA 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I 
61236 GGC C CAGGC C C TGC C AGGAAT C AAAGT C AGAAAC C - T GAGAGGGAAC T GAGGT C C C C C AA 61294 

1145 GACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACCCCCA 1204 

II I II II I I I I I I I I I I I I 

61295 GATCCTAGTCTAACCCCCACTCCCACA 61321 

1205 TCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACCACCC 12 64 

MM III I I I I I I I I I I III 

61322 AATCCGCTGCCATTTCGCTGCTCCATTTCCCATTCCTTGCCC 61363 

1265 TCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAACCCCA 1324 
I I I I II II II 

61364 TCCACCCTCACCA 6137 6 
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Qy 1325 CCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCCGGTT 1384 

I I I I I I I I I I ME 

Db 61377 GGC AGAATC C AGT T 61390 

Qy 1385 TGCC-CCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACTTGA 14 4 3 

II I I I I I I I I I I I I I I I I I I I I I I I I I I E 

Db 61391 CCCCTTCTGCTATCAATCCAGGGAAACCCCAGGCTTGGTGCTGGGATGTTTTT 6144 3 

Qy 1444 ACC TCAC AGAT C TGAGAGAAGCCAGGT T CAT T TAATGGT TCTGAGGGGCGGC TTGAGATC 1503 

till I I I I I I II I I I I I I I I I II II I I 

Db 61444 TGGGGGTCAGAGAATCAAGGGCATAGTCCTGAGGGGCCAGTTGAGATC 61491 

Qy 1504 C AC T GAGGGGAGTGG T T T T AGGC T C TGT GAGGAGGC AAGG TGAGAT GC TGAGGGAGGAC T 1563 

I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 614 92 GGC T GAGGGGAGC GG GCCC AAGC T C T GT GGC GAGGC AAGG TGAGAC T C TGAGGAAGGAC T 61551 

Qy 1564 GAGGAGGCACACACCCCAGGTAGATGGCCCCAAAATGATCCAGTACCACCCCTGCTGCCA 162 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61552 GAGGAGG C C C C C AC C C AAGATAGA- GGAAC C C AAAT AATC C AGC GC AGC TCCTGCTGC C A 61610 

Qy 1624 GCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCCCAC 1683 

I I I I I I I I I I I I I I I II III I I I I I III II I I I I I I I 

Db 61611 GTCCTGGACCACCCGG GGGAAGAC T TC TC A GGCTAGGCCATCCCAGCTCCCAC 61663 

Qy 1684 TGCCAC T TAACCCACAGGGCAATC TGTAGTCATAGC TTATGTGACCGGGGCAGGGT TGGT 1743 

I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I 
Db 61664 T GC C AC T AAAGC TAC AGGG GAC TC TAGAGT CAAGAGC T T GG T GT GC CCA 61712 

Qy 1744 C AGGAGAGGC AGGGC C C AG GCATC AAGG TC C AGC AT C CGC C C GG C AT T AGGG TC AGGAC C 1803 

I I I I I I I I I II I I I I I I I I I I I I I I II I II I I I I I I 

Db 61713 AGGCAGGGCCCAGGC --TCTGCCTGGCATCGGGGTC AGGAC C 617 52 

Qy 1804 CTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACCCCA 1863 

I I II I I I II I II I I I I I I I I I I I I I I I II I II 

Db 61753 T T GAGAGGGAAC T GAGGGC GC TAC AC C C CC AC CC C AT C C G CAT T C CAACA 61802 

Qy 18 64 CTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTGTCA 1923 

III II I I I I I I I I I II II III I I I I II II I I 

Db 61803 TGCCCAGCCCCATCCCCAACTCCGTTTTGCAGAATCCATTTTT TCCCCTGCAGTCA 618 58 

Qy 1924 ACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCAGGG 1983 

I II I MEM I II II I I II I II II II II I II I II I I I I III II I I II II 
Db 61859 ACCCCGGGAAGACCTGGGAATGGT C AGGC AC T C GGAT C T T GAC AT C C AC AT C G AGGG 61915 

Qy 1984 TC T GAT GGAGG GAAG GG GC TTG AACAGGGC C TC AGGGGAGC AGAGGGAG 2032 

II II II I I I I I I I II I II II II II I I I II II II I I 

Db 61916 CTGAAGGAGGGAGAGGGTTTGGTATCATGAGCAGAGCCTCAGGGTAGCAGAGGGAGGACC 61975 

Qy 2033 — GGC C C TAC T GC GAGATG AGGGAGGC C T C AGAGG AC CC AGC AC C C TAGGAC AC C G 2086 

I II II I III II II II I II I II II I II I I I II II II M II I I II I 
Db 61976 CTGGCCCTCCT GGGAGAT GAGGAAGGC C TC AGGAGAC C C AGC AC C C CAAGGC AGGG AGC C 62035 

Qy 2087 C ACCC C TGT C TGAGAC T GAG— GC TGCCAC TTCTGGCCTCAAGAATCAGAACGATG 2140 

I I II II I I II II II II II I I II I I I I II I I II II I I II II 
Db 62036 CACCCCACCCCGTCTGAGAATGAGGTGCCTCCTCTTTTAGCCTCAGGAATCCAAGGGATG 62095 

Qy 2141 GGGACTCAGAT TGCATGGGGGTGGGA- - CCCAGGCC TGCAAGGCTTACGCGGAGGAAGAG 2198 

I II II I I I I II I II II I I I I I I I II I I I I II I I I I 

Db 62096 GC AAC TC AGGT C AGC AGAGGGGTGGGT T CC AAGC C C T T C C AGGAT C AAGGAAAGGAAGAC 62155 
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Qy 2199 GAGGGAGGACTCAGGGGACCTTGGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTC 2258 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 62156 GAGGGAGGATTCAGGGGGCCTTGCATTCCAGATCAGTGGAGACCTGGGCCCTGGGAGGTC 62215 

Qy 2259 CAGGGCACGGTGGCCACATATGGCCCATATTTCCTGCATCTTTGAGGT GACAGGAC 2314 

I I I I I I III I I I I I I I II I I I I I I I II I I I I I I I II I I I II I I I I 

Db 62216 CTGGGCAAGGT AGCC ACC T GTAGC TCAT AC T T CC TGCATC TTCGAGGT CACAGAGAGGAG 62275 

Qy 2315 AGAGC T G T GGT C TGAGAAG TGGGGCC TC AGGT C AAC AGAGGGAGGAGT T CC AGGAT C CAT 2374 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6227 6 AGGGCTATGGTCTGAGGGGTGGTACTTCAGGTCCGCAGAGGGAGGAGTCCCAGGATCTAC 62335 

Qy 2375 ATGGCCCAAGATGTGCC-CCCTTCATGAGGACTGGGGATATCCCCGGCTCAGAAAGAAGG 2433 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 62336 AGGAC CC AAGG T GT GC C AC AC T TC AC GAGGAATGGGGATAC C TG T GGC T CAGAAAGAC GG 62395 

Qy 2434 GACTCCACACAGTCTGGCTGTCCCCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGG 2493 

II I Mill I I I I I I I I I II I I I I I II MINI I I I I I I I I I I I I I I I I I II 

Db 62396 GACCCCACAGAGTCTGGCTGTCCCCTGTTCTTAGCTCAGGGGGGACCAGAGGAGGGATGG 62455 

Qy 2494 CGG TAT G T T C C AT T C TC AC T TGTAC C AC AGGC AGGAAGT T GGGGGGC C C TC AGGGAGATG 2553 

I I I I I I III I I I I I I I I I I I I I II I I I I I I I I I I I II I II I I I I I I I I I I I 
Db 62456 CC C TAT G T GC C AAT T TC AC T TGT T C C AC AGGC AGGAAGT T GGGGAACC T TC AGGGAGATG 62515 

Qy 2554 GGGTCTTGGGGTAAAGGGGGGATGTCTACTCATGTCAGGGAATTGGGGGTTGAGGAAGCA 2613 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 62516 AGGTTTTGGAGTAAAGGGGCAATGTTTGCTCATCTCAGGGGGTTGGGGGTTGAGGAAGGG 6257 5 

Qy 2614 C AGGC GC T GGC AGGAAT AAAGAT GAGTGAGAC AGAC AAGGC T AT T GGAATC C AC AC C C C A 2 673 

I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 6257 6 C AGGC C C T GT C AGGAGC AAAC AT GAG TAC C C C AC AG GAGGCC AT C AGAACC C T C AC C C C A 62 63 5 

Qy 2674 GAACCAAAGGGGTC AGCC C TGGAC ACC T CAC C C AG GATGTGGCTTCTTTTTC 2725 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 62636 GAACCAAAGGGGTCAGCCCTGGGCACCCCACACAGGGGTGACAGGATGTGGCTCCTTCTC 62695 

Qy 2726 AC TCCTGTTTC C AGAT C T GGGGC AGGT GAGGAC C T C AT T C TC AGAGGG T GAC T C AGGT C A 2785 

I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 62696 AT T TC T GAT T C C AGATC T CAGT GAGGT GAGGAC C T T GT TC TC AGAGGG T GAC T C AGGT C A 62755 

Qy 278 6 AC GTAGGGACCCCCATCTGGTCTAAAGAC AGAGC GGTCCCAGGATCTGCCATGCGTTCGG 284 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I 
Db 62756 CCACAGGGACCCCCATCTGGTCTACAGACACAGTGGTCCCAGGATCTGCCAAGAGTCCTG 62815 

Qy 2846 GTGAGGAAC AT GAGGGAGGAC TGAGGGTACCC CAGGACCAGAAC AC TGAGGGAGAC TGCA 2 905 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III II 
Db 62816 GT GAGGAAT GT GAGG GAGGAT TGAGGGT AC C AC AGG GCC AGAAC GC AGAT GAT GAC C C C A 6287 5 

Qy 2906 CAGAAATCAGCCCTGCCCCTGCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAG 2965 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I III 
Db 62876 C AGAAATC AGC CCTGCTCCTGTTGTCACCC C AGAGAGC AT GGGC T T GGC T T T C T GC T GAG 62935 

Qy 2966 GTCCTTCCGTTATCCTGGGATCATTGATGTCAGGGACGGGGAGGCCTTGGTCTGAGAAGG 3025 

I I I I II I I I I I I I I I I I I I I II I I I I I III I I I I I I I I I I I I I I I I I I II 
Db 62936 GTCCCTCTCTTATCCTGGGATCACTGGTGTCACGGAGTGGGAGGCCTTGGTCTGAGGGGG 62995 

Qy 3026 CTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCCCTGCCAGGAGTCAAGGTGAGGACCA 3085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 
Db 62996 C TG C AC C C AGG T C AG T AGAGGGAGGGTC C C AGGC TC T GC C AGGAGT TG AGGT GAGGAC C A 63055 

Qy 3086 AGC GGGC ACC TCACCCAGGACACATTAATTCCAATGAATTTTGATATCTCTTGCTGCCCT 314 5 
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Ill III II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 I I 

Db 63056 AGCAGGCTCCGCATCCAGGACACATGGGTTCCAATGAATTTCGACATCTTTTGCTGTCGT 63115 

Qy 3146 TC-CCCAAGGACCTAGGCACGTGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCT 3204 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 63116 TCTTCGGAAGACCTAGGCACAGGTGGCCAGATGTGGGGTTTCTTAGGTCCT GTTCCC 63172 

Qy 3205 TAT C ATGGATG TGAAC T C T TGAT T TGGAT T TC T C AGAC C AGC AAAAGGGC AG GAT C C AGG 3264 

I III I I I I I I I I I I I I I I I II MINIM I I I I I I I I I I I I I I I I I I I I 
Db 63173 TCTCAGGCATGTGAGCTCTTGATCTGAGTTTCTCAGGCCAGCAAAAGAGTGGGATCCAGG 63232 

Qy 32 65 C C C T GC C AGGAAAAATATAAGGGC C C TGC GTGAGAACAGAGGGGG T CAT CC AC T GC ATGA 3324 

I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 63233 C C C T GC C T GGAGAAATG TG AGGGC C C T GAGTGAAC ACAGT GGGGAT C AT CC AC T C C ATGA 63292 

Qy 3325 GAG T GGGGAT G TCAC AGAG T C C AGC C C AC C C T C C T GGTAG C AC T GAGAAGC C AGGGC TGT 3384 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I II I I I I I I I 
Db 63293 GAG TGGGGAC C TCAC AGAG T C C AGC C TAC C C T C T T GATGGC AC T GAGG GAC C GGGG C TGT 63352 

Qy 3385 GCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCAGGAACCAGG 34 44 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 63353 GC T TACAG TC T GC AC C C TAAGGGC CC AT GGAT TC C T C TC C T AGG AGC T C C AGGAAC AAGG 63412 

Qy 3445 C AG TGAGGC C T TGGT C TGAGAC AG TATC C TCAGGT C AC AGAGC AGAGGATGC AC AGGGT G 3504 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 63413 CAGTGAGGCC T TGGT C TGAGAC AG TGT C C TCAGGT TAC AG AGC AGAGGATGC AC AGGC TG 63472 

Qy 3505 TGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAGGACACA 3564 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 63473 TGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAAGACACA 63532 

Qy 3565 TAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAATCGACCTCTG 3624 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 
Db 63533 T AGGAC T C C AAAGAG T C T GGC C T C AC C T C C C TAC C ATC AAT C C T GCAGAAT C GAC C TC T G 63592 

Qy 3625 CTGGCCGGCTGTACCCTGA-GTACCCTCTCACTTCCTCCTTCAGGTTTTCAGGGGACAGG 3683 

I I I I I I I I I I I I I I I I I I it I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 63593 CTGGCCGGCTATACCCTGAGGTGCTCTCTCACTTCCTCCTTCAGGTTCTGAGCAGACAGG 63 652 

Qy 3684 CCAACCC AGAGGACAGGAT TCCC TGGAGGC CACAGAGGAGC ACC AAGGAGAAGATC TGTA 3743 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 63653 C C AAC CG - GAGGAC AGGAT T C CC TGGAGG C CACAGAGGAGC AC C AAGGAGAAGAT C TG T A 63711 

Qy 3744 AGT AGGC C T T T GT T AGAGT C T CC AAGGT T C AG T T C T C AGC T GAG GC C T C TCAC AC AC T C C 3803 

I I I I I I I I I I I I I I I I I III III II I I I I I I I I I I I I I I I I I I I I II MM 
Db 63712 AGTAAGCCTTTGTTAGAGCCTCTAAGATTTGGTTCTCAGCTGAGGTCTCTCACATGCTCC 63771 

Qy 3804 CTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTG 3863 

I I I II I I I I I II II I I I I I II II I I I II I II I I I II I I II II I I I I I I I I I 
Db 63772 CTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCCAGCTTTTGCCTGCACTCTTGCCTGCTG 63831 

Qy 38 64 C C C TGAC GAG AGT C ATC AT GTC T C T TGAGC AG AGGAGT C T GC AC TGC AAGC C T GAGGAAG 3923 

I M I I II I I II I I I II I I II M I I I I II I I I I I I I I I II I I I I I I II I II I I II I 
Db 638 32 C C C T GAC C AGAGT C ATC AT GT C T T C TGAGC AGAAGAGTC AGC AC T GC AAGC C TGAGGAAG 63891 

Qy 3924 CCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I II I I I II I I I I II I I I I I II I I I I II I I I II III I I I I I I I II 
Db 63892 GCGTTGAGGCCCAAGAAGAGGCCCTGGGCCTGGTGGGTGCACAGGCTCC TAC TACT GAGG 63951 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGC 4 019 

I I I II II I II I I I II I I I II I I I I I I I I II I I I I II I II II 
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Db 63952 AGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTCTGGTCCCTGGCACCCTGGAGGAAGTGC 64011 

Qy 4020 CCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTA 4079 

I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 64012 C TG C T GC T GAGTC AGC AGG T CC T C C CCAGAGT C C TC AGGGAGC C TC TG C C TT AC C C AC T A 64071 

Qy 4080 CC ATCAAC TTC AC TC GACAGAGGC AACC CAGTGAGGGTTC CAGC AGC C GTGAAGAGGAGG 4139 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 64072 CC ATC AG C T TC AC T T GC TGGAGGC AAC C C AAT GAGGGT TC CAGC AGC C AAGAAGAGGAGG 64131 

Qy 4140 GGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGG 4199 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III III I I I I I I I 
Db 64132 GGCCAAGCACCTCGCCTGACGCAGAGTCCTTGTTCCGAGAAGCACTCAGTAACAAGGTGG 64191 

Qy 4200 CTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAG 4259 

III I I I I I I I I I I I I I I I I III I II I I I I I I I I I I I I I I I I I I I II I I I I 
Db 64192 ATGAGTTGGCTCATTTTCTGCTCCGCAAGTATCGAGCCAAGGAGCTGGTCACAAAGGCAG 64251 

Qy 42 60 AAATGC T GGAG AGT G TC AT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C TT C GGC AAAG 4 319 

I I I I I I I I I I I II I I I I I II I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I 
Db 64252 AAATGCTGGAGAGAGTCATCAAAAATTACAAGCGCTGCTTTCCTGTGATCTTCGGCAAAG 64311 

Qy 4320 CC T C T GAGT C C T TGC AGC T GGTC T T TGGC AT T GAC G T GAAGGAAGC AGAC C C CAC C GGCC 4379 

I I I I I I I I I I II II II I I I I I I I I I I I II I I I I II I I I I I I I I I I I II II 

Db 64312 CC T C C GAGT C CC TGAAGAT GATC T T TGGC AT T GAC G T GAAGGAAGT GGAC C C CGC C AGC A 64371 

Qy 4380 ACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATC 4439 

II I I II I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64372 ACACCTACACCCTTGTCACCTGCCTGGGCCTTTCCTATGATGGCCTGCTGGGTAATAATC 64431 

Qy 4440 AGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCG 4499 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 64432 AGATCTTTCCCAAGACAGGCCTTCTGATAATCGTCCTGGGCACAATTGCAATGGAGGGCG 64491 

Qy 4500 GC C AT GC T C C T GAGG AGGAAAT C T GGGAGGAGC TGAG T GT GAT GGAGG T GTAT GAT GGGA 4559 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 64492 AC AGC GC C T C T GAGG AGGAAAT C T GGGAGGAGC T GGG TGT GAT GGGGG T GTAT GAT GGGA 64551 

Qy 4560 GGGAGC AC AGT GC C T ATGGGGAGC C C AGGAAG C TGC T C AC C C AAGAT T T GGT GC AGGAAA 4 619 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 64552 GGGAGC AC AC TGTC T ATGGGGAGC CCAGGAAAC TGC T CAC CC AAGAT TGGGT GC AGGAAA 64611 

Qy 4 620 AGT AC C T GGAG TA- C GGC AGGTGC C GGAC AGT GAT C C C GC AC G C TAT GAGT T C C TGT GGG 4 678 

I I I I I I I I I I I I I I I II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 64612 ACTACCTGGAGTACCGGCAGGTACCCGGCAGTAATCCTGCGCGCTATGAGTTCCTGTGGG 64 671 

Qy 4679 GTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCA 4738 

I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I III I I I I I 
Db 64672 GTCCAAGGGCTCTGGCTGAAACCAGCTATGTGAAAGTCCTGGAGCATGTGGTCAGGGTCA 64731 

Qy 4739 GTGC AAGAGT TC GC TTTTTCTTCC CAT C C C TG C GTGAAGC AGC T T TGAGAGAGGAGGAAG 47 98 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I 
Db 64732 AT G C AAGAGT TC GC AT TGC C TACC CAT C C C TG C GTGAAGC AGC T T TGT T AGAGGAGGAAG 64791 

Qy 4799 AGGGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGG GGAC TGGGCC AGT G 48 54 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I II II I I I I I I I I I I I 

Db 64792 AGGGAGTCTGAGCATGAGTTGCAGCCAGGGCTGTGGGGAAGGGGCAGGGCTGGGCCAGTG 64851 

Qy 4855 CACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTT 4914 

IE II II III II I I I I I I I I I I I I I I I I I I II I I 1 I I I I I I I I I I I I I I I I 
Db 64852 CATCTAACA — GCCCTGTGCAGCAGCTTCCCTTGCCTCGTGTAACATGAGGCCCATTCTT 64909 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


4915 CACTC TGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGA 4 970 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I III 

64910 CACTCTGTTTGAAGAAAATAGTCAGTGTTCTTAGTAGTGGGTTTCTATTTTGTTGGATGA 64969 

4971 CTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGG 5030 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I 
64970 CTTGGAGATTTATCTCTGTTTCCTTTTACAATTGTTGAAATG-TTCCTTTTAATGGATGG 65028 

5031 T TGAATGAAC T TC AGC ATC C AAGT T TAT GAAT GAC AGC AG TC AC AC AG T T C T GT GT ATAT 5090 

M I I I I I I I I I I I M I I I I I I II I I I I I I I I II I I I I I I I I I I I I 

65029 T TGAAT T AAC T TC AGC AT C C AAGT T TAT GAAT CGT AGT T AAC G TAT AT T GC T GT TAATAT 65088 

5091 AGT TT AAGGGT AAGAGTC T TGTGT T T TAT TC AGAT T GGGAAATC C ATTC T AT TT TGTGAA 5150 

I I I I I I I I I M.I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
65089 AGT TTAGGAGTAAGAGTCTTGTTTTT TAT TCAGATT GGGAAATC CGTTC TAT TT TGTGAA 65148 

5151 TTGGG AT AAT AAC AGC AG TGGAATAAGT AC T T AGAAAT GT GAAAAAT GAGC AGTAAA 5207 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
6514 9 T T T GGGAC AT AATAAC AGC AGTGGAGTAAGT AT T T AGAAG T GT G AATTCACCGTGAA 65205 

5208 ATAGATGAGATAAAGAAC T AAAGAAAT TAAGAGATAGTCAAT TC TTGC C TTATACC TCAG 5267 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

65206 ATAGGTGAGAT AAAT T AAAAG AT AC T T AAT TC CC GC C T TAT GC C T C AG 65253 

52 68 TCTATTCTGTAAAATTT-TTAAAGATATATGCATACCTGGATTTCCTTGGCTTCTTTGAG 532 6 
I IE I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
65254 TCTATTCTGTAAAATTTAAAAAATATATATGCATACCTGGATTTCCTTGGCTTC GTG 65310 

5327 AATGTAAGAGAAATTAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCT 5386 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
65311 AATGTAAGAGAAATTAAATC TGAAT AAAT AAT TCTTTCTGTT AAC TGGCTC AT TTCTTCT 65370 

5387 CCATGCACTGAGCATCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTA 54 46 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III I I I I 
65371 C T ATGC AC T GAGC AT C TGC T C TGT GGAAGGC C C AGGAT TAG TAG TGGAGAT AC T AGGGT A 654 30 

5447 AGC C AGAC T CAT AC C C AC C C AT AGGGTC GTAGAGT C T AGG AGC T GC AG T C AC GT AAT C GA 5506 

I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I 

65431 AGC C AGAC AC AC AC C T AC C GAT AGGGT AT TAAGAGT C TAG GAGC GC GG TC AT ATAAT T AA 65490 

5507 GGTGGCAAGATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGC 5566 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 

654 91 GGT GAC AAGAT GT C C T C TAAGATG T AGGGGAAAAGT AACGAGTGTGGGTATGGGGC 6554 6 

5567 TCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAA 562 6 

III I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
65547 TCCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGTG-TGGGGCCTTTTGGGCTTTGGGAAA 65605 

5627 CTGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
65606 CTCCATTTTCTTCTGAGGGATCTGATTCTAATGAAGCTTGGTGGGTCC 65653 
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(without alignments) 
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1 CCCGGGGCACCACTGGCATC TAAT GAT C T T GGGT GGAT C C 5 67 4 
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5244920 seqs, 3486124231 residues 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 


SUMMARIES 


Result Query 


No . 

Score 

Match 

Length 

DB 

ID 

Description 

1 

5674 

100. 

0 

5674 

2 

AAQ72 477 

Aaq724 7 7 Tumour re 

2 

5674 

100. 

0 

5674 

2 

AAX84113 

Aax84113 MAGE-1 ge 

3 

5672 . 4 

99. 

9 

5674 

2 

AAQ32352 

Aaq32352 MAGE-1 nu 

4 

5650 . 8 

99. 

6 

5724 

2 

AAQ98 902 

Aaq98902 Tumour re 

5 

2655 

46. 

8 

11495 

2 

ABQ76203 

Abq76203 Human turn 

6 

2513 . 6 

44 . 

3 

4895 

2 

ABQ76204 

Abq7 6204 Human turn 

7 

2513 . 6 

44 . 

3 

4895 

7 

ADS73099 

Ads73099 Human kid 

8 

2513 . 6 

44 . 

3 

4895 

7 

ADW41953 

Adw41953 cDNA elev 

9 

2429 . 6 

42. 

8 

4736 

2 

ABQ76206 

Abq7 6206 Human turn 

10 

2422 . 8 

42. 

7 

4741 

2 

ABQ76205 

Abq76205 Human turn 

11 

2419 

42. 

6 

2419 

2 

AAQ32351 

Aaq32351 Antigen E 

12 

2419 

42. 

6 

2419 

2 

AAQ72476 

Aaq7247 6 Tumour re 

13 

2419 

42. 

6 

2419 

2 

AAX84112 

Aax84112 Antigen E 

14 

2415 . 8 

42. 

6 

2419 

2 

AAT05086 

Aat05086 MZ2-MEL a 

15 

2408 

42. 

4 

2420 

2 

AAQ72472 

Aaq72472 Tumour re 

16 

2408 

42. 

4 

2420 

2 

AAQ85435 

Aaq85435 Human mel 

17 

2408 

42. 

4 

2420 

2 

ABQ76198 

Abq76198 Human turn 

18 

2408 

42. 

4 

2420 

8 

ABQ83847 

Abq83847 Human MAG 

19 

2408 

42 . 

4 

2420 

10 

ADC09583 

Adc09583 MAGE-1 DN 

20 

2408 

42. 

4 

2420 

12 

ADM72822 

Adm72822 Human MAG 

21 

2408 

42. 

4 

2420 

12 

ADQ36554 

Adq36554 Human MAG 

22 

2408 

42. 

4 

2420 

13 

ADT93875 

Adt93875 Non-small 

23 

2408 

42. 

4 

2420 

14 

ADW44 360 

Adw44 360 Human mel 

24 

2408 

42. 

4 

2420 

15 

AEF02866 

Aef028 66 Wild-type 

25 

2408 

42. 

4 

2420 

15 

AEF13905 

Aefl3905 Human MAG 

26 

2404 . 8 

42 . 

4 

2420 

9 

ACD42236 

Acd42236 Human MAG 

27 

2404 . 8 

42. 

4 

2420 

9 

ACH04045 

Ach04045 Human cDN 

28 

2400. 6 

42. 

3 

2418 

2 

AAX84103 

Aax84103 E antigen 

c 29 

2307 . 6 

40. 

7 

302250 

6 

ABL67703 

Abl67703 Oesophagu 

30 

2306 

40. 

6 

302250 

6 

ABL67703 

Abl67703 Oesophagu 

31 

2117 . 8 

37. 

3 

4559 

2 

ABQ7 6199 

Abq76199 Human turn 

32 

2117 . 8 

37. 

3 

4559 

8 

ABQ83848 

Abq83848 Human MAG 

33 

2117 . 8 

37. 

3 

4559 

10 

ADC09584 

Adc09584 MAGE -2 DN 

34 

2117 . 8 

37. 

3 

4559 

12 

ADM72823 

Adm72823 Human MAG 

35 

2058.8 

36. 

3 

4157 

2 

AAQ72478 

Aaq72478 Tumour re 

36 

2058.8 

36. 

3 

4157 

2 

AAX84114 

Aax84114 MAGE- 2 ge 

37 

2057.2 

36. 

3 

4157 

2 

AAQ32353 

Aaq32353 MAGE -2 ge 

38 

1945 

34 . 

3 

4523 

4 

AAD06131 

Aad06131 Human MAG 

39 

1945 

34 . 

3 

4523 

12 

AD023388 

Ado23388 DNA encod 

40 

1932 

34 . 

1 

2014 

8 

ABX95024 

Abx95024 DNA encod 

41 

1765.8 

31. 

1 

4204 

4 

AAS02056 

Aas02056 DNA encod 

42 

1765.8 

31. 

1 

4204 

9 

ACH04024 

Ach04024 Human cDN 

43 

1762.6 

31. 

1 

4204 

2 

ABQ76200 

Abq76200 Human turn 

44 

1762.6 

31. 

1 

4204 

2 

AAX26974 

Aax26974 cDNA enco 

45 

1762.6 

31. 

1 

4204 

3 

AAA37927 

Aaa37 927 Human MAG 


ALIGNMENTS 


RESULT 1 
AAQ72477 
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ID 
XX 
AC 
XX 
DT 
DT 
XX 
DE 
XX 
KW 
KW 
XX 
OS 
XX 
FH 
FT 
FT 
XX 
PN 
XX 
PD 
XX 
PF 
XX 
PR 
XX 
PA 
XX 
PI 
XX 
DR 
XX 
PT 
PT 
XX 
PS 
XX 

cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 

XX 
SQ 


AAQ72477 standard; DNA; 5674 BP. 
AAQ72477; 

25-MAR-2003 (revised) 
22-JUN-1995 (first entry) 

Tumour rejection antigen MAGE-1 encoding DNA. 

Tumour rejection antigen; melanoma antigen- 1; MAGE-1; MAGE- 3; cancer; 
cytolytic T cells; antigen D; human leucocyte antigen; ss. 


Homo sapiens . 

Key 
CDS 


WO9423031-A1 
13-OCT-1994 . 
17-MAR-1994; 
26-MAR-1993; 


Location/Qualifiers 
3881. .4711 
/*tag= a 


94WO-US002877 . 
93US-00037230. 
(LUDW-) LUDWIG INST CANCER RES. 

Gaugler B, Van Den Eynde B, Boon-Falleur T, Van Der Bruggen P; 
WPI; 1994-333192/41. 

New tumour rejection antigen precursor MAGE 3 - useful in treatment and 
diagnosis of cancer. 

Example 26; Page 59; 105pp; English. 

AAQ72477 is the DNA sequence which encodes melanoma antigen- 1 (MAGE-1) . 
Another melanoma antigen MAGE- 3 is encoded by AAQ72470, this is a tumour 
rejection antigen precursor. Melanomas characterised by the expression of 
MAGE-3 can be detected, or monitored, by contacting a test sample with an 
agent that can recognise MAGE-3. The melanoma can be treated by the 
administration of cytolytic T cells specific for the complex of antigen D 
(the mature rejection antigen derived from MAGE-3) and a human leucocyte 
antigen (esp. HLA-A1) . (Updated on 25-MAR-2003 to correct PN field.) 
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Length 5674; 
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0; 


Qy 

Db 

Qy 

Db 

Qy 


1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 
I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I 
1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 


61 


60 


60 


120 


ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 
I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 
61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

121 C TC T C AAC C CAGGGAAGC C C AGGT GCC C AGAT GT GAC GCC AC TGAC T T GAGC AT TAG T GG 180 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

Qy 181 T T AGAGAGAAGC GAGGT T T TCGGT C T GAGGGGC GGC T TGAGAT C GGTGGAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 T T AGAGAGAAGC GAGGT T T TCGGT C T GAGGGG C GGC T TGAGAT C GGTGGAGGGAAGC GGG 240 

Qy 241 C C C AGC T C TGT AAGGAGGC AAGGT GAC ATGC T GAGGGAGG AC T GAGGAC CC AC T T AC C C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 241 CC C AGC T C TGT AAGGAGGC AAGGT GAC ATGC T GAGGGAGG AC TGAGGAC C C AC T TAC C C C 300 

Qy 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 3 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M II I I II I 
Db 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

Qy 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CAT GC TC AGGAT TC T C AAGGAGGGC T GAGGGT C C C T AAGAC C C C AC TC C C G T GAC C C AAC 540 

I I I I H I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

Qy 781 GAAGC GAGGT T T C CAT TC T GAGGGACGGCGTAGAGT TC GGC CGAAGGAAC C T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGG T T T C CAT T C T GAGGGACGG C GT AGAG T T C GG C C GAAGGAAC C T GAC C C AGG 840 

Qy 841 C T C T GTGAGGAGGC AAGGT GAGAGGC TGAGGGAGGAC T GAGGAC C C C GC C AC T C C AAATA 900 

I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 841 C T C T GTGAGGAGGC AAGGT GAGAGGCT GAGGGAGGAC TGAGGAC C C C GC C AC T C C AAATA 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

Qy 1021 T T C TC C C C AAGC T C T GGAATC AGAGGT T GC TG TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

I I I II I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I 
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Db 1021 T T C T C CC C AAGC T C T GGAATC AGAGGT T GC TG TGAC C AGGGC AG GAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GC AGGGC AC AGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 14 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 T GAAC C T C AC AGAT C T GAGAGAAGC C AGGT T C AT T T AAT GGT TC T GAG GGGC GGC T TGAG 1500 

I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T GAAC C T C AC AGAT C T GAG AGAAGCC AGGT TC AT T T AAT GGT TC T GAG GGGC GGC T TGAG 1500 

Qy 1501 ATC CAC TGAGGGGAGTGGT TTTAGGC TC TGTGAGGAGGCAAGGT GAGATGC TGAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 AT C CAC T GAGGGGAG T GGT T T T AGGC T C T GTGAGGAGGC AAGGT GAGATGC T GAGGGAGG 1560 

Qy 1561 ACTGAGGAGGCACACACCCCAGGTAGATGGCCCCAAAATGATCCAGTACCACCCCTGCTG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AC T GAGG AGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT CC AGT ACC AC C C C T GC T G 1620 

Qy 1621 C C AGC C C T GGAC CAC C C GGCC AGG AC AGAT G T C T C AGC T GGAC C ACC C CCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CAC TGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATG TGAC CGGGGCAGGGTT 1740 

Qy 1741 GG T C AGGAGAGGC AGGGC C C AGGC AT C AAGGT C C AGC AT CCGCCC GGC AT TAGGGTC AGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GGT C AGGAG AGGC AGGGC C C AGGC ATC AAGGT CC AG CAT CCGCCC GGC AT TAGGGTC AGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AC C C T GGGAGGGAAC TGAGGGT TC C C CAC C CAC AC CTGTCTCCT CAT C TC C AC C GC CACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 
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Qy 1981 GGGTC TGATGGAGGGAAGGGGC TTGAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GGGTC TGATGGAGGGAAGGGGC TTGAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

Qy 2041 TGC GAGATGAGGGAGGCC TCAGAGGACC CAGC ACCC TAGGACAC CGCACCCC TGTC TGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 TGC GAGATGAGGGAGGCC TCAGAGGACC CAGC ACCC TAGGACAC CGCACCCC TGTC TGAG 2100 

Qy 2101 AC T GAGGC TGC C AC T T C T GGC C TC AAGAAT C AGAAC GATGGGGAC TC AGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 AC T GAGGC TGC C AC T TC T GGC C TCAAGAATC AGAAC GAT GGGGAC TC AGAT T GC AT GGGG 2160 

Qy 2161 GTGGGAC CC AGGCCTGCAAGGCTTACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGACC TT 2220 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 GT GGGAC CC AGGC C T GCAAGGC T TAC GC GGAGGAAGAGGAGGGAGGAC TC AGGGGAC C T T 2220 

Qy 2221 GGAAT C C AGAT C AG T GTGGAC C TC GGC C C TGAGAGG T C C AGGGC ACGG TGGC CAC ATAT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 GGAAT C C AGAT C AGT GTGGACC TC GGC C C TGAGAGG TC C AGGGC ACGG TGGC CAC ATAT G 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 T C AGGTC AAC AGAGGGAGG AGT TC C AGGAT C CAT AT GGC C C AAGATGT GC C C C C T T C ATG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 T C AGGTC AAC AGAGG GAGGAGT TC C AGGATC C AT AT GGC C C AAGATGT GC C C C C T T CAT G 2400 

Qy 2401 AGGAC T GGGGATAT C C C C GGC T C AGAAAGAAG GGAC TC C AC AC AGTC T GGC TGTC C C C T T 2460 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 AGGAC T GGGGATAT C C C C GGC T C AGAAAGAAG GGAC TC CAC AC AGTC T GGC TGTCCCCTT 2460 

Qy 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T CAT G TC AGGGAAT T GGGGGTT GAGGAAGC AC AG GC GC T GGC AGGAAT AAAGAT GAGT 2 640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 AC T CAT G T C AGGGAAT T GGGGGTT GAGGAAGC AC AGGC GC T GGC AGGAAT AAAGAT GAGT 2640 

Qy 2641 GAG AC AG AC AAGGC TAT T GGAATC C AC AC C C C AGAAC C AAAGGG GTC AGC C C T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 GAGAC AGAC AAGGC TAT TGGAATC CAC AC C C C AGAAC CAAAGGGG T CAGC C C TGGAC AC C 2700 

Qy 2701 TC AC C C AGGAT GT GG CTTCTTTTT CAC T CC T G T TT C C AGAT C T G GGGC AGGTGAGG ACC T 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 
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Qy 2881 GAC C AGAAC AC TGAGGGAGAC TGC AC AG AAAT C AGC CCTGCCCCTGCT GTC ACC C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I 

Db 2881 GAC C AGAAC AC TGAGGGAGAC TGC AC AG AAAT C AGC CCTGCCCC TGC T GTC ACC C C AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 AC GGGGAGGC C T TGG TC T GAGAAGGC T G C GC T C AGG T C AG T AGAGGGAGC GT CC C AGGC C 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C TGC C AG GAGT C AAGGT GAGGACC AAGC GGGC AC C T C AC C C AGGAC AC AT T AAT TC C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 C TGC C AGGAG T C AAGGT GAGGAC C AAGC GGGC AC CT C AC C C AGGAC AC AT T AAT T C C AAT 3120 

Qy 3121 GAAT T T T GAT AT C T C TT GC TGC C C T TC C CCAAGGAC C T AGGC AC GT GT GGCC AGAT GT T T 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I II I I 

Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3241 AC C AGC AAAAGGGC AGGAT C C AGGC C C T GC C AGGAAAAAT AT AAGGGC C C TG C GT GAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 G T AGC AC T GAG AAGC C AGG GC T GT GC T T GCGGT C TGCAC C C T GAGGGC C C GT GGAT T CC T 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTC TGCAC CCTGAGGGCCCGT GGAT TCCT 3420 

Qy 3421 C T T C C TGGAGC T C C AGGAAC C AGGC AGT GAGGC C T T GGT C T GAG AC AG T ATC C TC AGGT C 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 AC AGAGC AGAG GAT GCACAGGGT G TGC C AGC AGT GAAT GT T TGC C C T GAAT GC AC AC C AA 3540 

Qy 3541 GGGC C CC AC C T GC C AC AGGAC AC AT AGGAC T C C AC AGAG T C TGGC C T C AC C T C C C T AC T G 3600 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 3541 GGGC C CC AC C T GC C AC AGG AC AC ATAGGAC T CC AC AGAGT C TGGC C TC AC C T C C C T AC T G 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 C C T T C AGGT T T T C AGGGGAC AGGC CAAC CC AG AGGAC AGGAT T C C C TGGAGGC C AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3661 C C T TC AGGT T T T C AGGGGAC AGGC C AAC CC AGAGGAC AGGATT C C C T GGAGGCC AC AGAG 3720 

Qy 3721 GAGC AC C AAGGAGAAGAT C T G TAAGT AGGC C T T T GT T AGAGTC T C C AAGGT TC AGT TC T C 3780 

I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 3721 GAGC ACC AAGGAGAAGATCTGTAAGTAGGCCTTTGTT AGAGTC TCC AAGGT TC AGT TCTC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 
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II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I E I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C TGC CC AC AC TCCTGCCTGCTGCCCT GAC GAGAGT C ATC ATGT C TC T TGAGC AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 C C TGC CC AC AC TC C T GCC TGC TGC C C T GAC GAGAGT CATC ATG T C T C T T GAG C AGAGGAG 3900 

Qy 3901 T C TGC AC TGC AAGC C TGAGGAAGC C C T T GAGGC C C AAC AAGAGGCC C T GGGC C T GG TGT G 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 T C T GC AC TGC AAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGGCCC T GGGC C TGG TGT G 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 C AC T GC T GGGT C AAC AGATC C TC C C C AG AGTC C TC AGGGAGC CTCCGCCTTTCC C AC TAC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

Qy 4081 CAT C AAC T TC AC T C GAC AGAGGC AAC C C AGT GAGGG T TC C AGC AGC C G TGAAGAGG AGGG 4140 

. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 4081 CATC AAC T TC AC TC GAC AGAGGC AAC C C AGT GAGGG T TC C AGC AGC C G TGAAGAGG AGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4201 TGATTTGGTTGGTTTTC TGC TCCTCAAAT ATC GAGCC AGGGAGC CAGTCACAAAGGCAGA 4260 

Qy 4261 AAT GC TGGAGAGTGT CAT C AAAAAT TAC AAGC AC TGTTTTCC TG AGAT C T T C GGC AAAGC 4 320 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 61 AAT GC TGGAGAGT GT CAT C AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC 4320 

Qy 4321 C TC T GAG T C C T T GC AGC T GGT C T T T GGC AT TGAC GT GAAGGAAGCAGAC C C C AC CG GCC A 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGC AT TGACGT GAAGGAAGCAGAC CCCACCGGCC A 4 380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4 441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

Qy 4501 CCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 501 C C ATGC T C C T GAGGAGGAAATC T GGGAGGAGC T GAGTGT GATGGAGG T GTAT GATGGGAG 4 560 

Qy 4561 GGAGCAC AGTGCC TATGGGGAGCC CAGGAAGC TGC T CACC CAAGAT T T GGTGCAGGAAAA 4620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4561 GGAGC AC AGTGC C T ATGGG GAGC C CAGGAAGC TGC TC AC CCAAG AT TT GGTGCAGGAAAA 4620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 4741 GC AAGAG TTCGCTTTTTCTTCC C ATC CC T GC G T GAAGC AGC T T TGAGAGAGGAGGAAGAG 4800 

I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I 1 I ! I I I I I II I I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCTTCC CAT C C C T GC G TGAAGC AG C T T TGAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 4801 GGAGTC T GAGC ATGAGT TGC AGCC AAGGC C AG TGGGAGGG GGAC TGGGC C AGT GCACC T T 4860 

Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

I I I I I I I I I I I I I I I I I I I I M I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

Qy 4921 GAAGAGAGC GG TC AG TG TT C T C AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 4921 GAAGAGAGC GG TC AG TGT T C T C AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T TGGAGAT T 4980 

Qy - 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 T TC AGCATCCAAGT T TATGAATGACAGC AGTC ACAC AGT T C TGTGTAT ATAGT TTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTT TATGAATGACAGC AGTCACACAGTTC TGTGTAT ATAGTTTAAGGG 5100 

Qy 5101 T AAGAGT CTTGTGTTT TAT T C AGAT T GGGAAAT C CAT T C TAT T T TG T GAAT TGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 T AAGAGT C TTGTGTTT TAT TC AGAT TGGGAAATC C AT T C TAT T T TG T GAAT TGGGATAAT 5160 

Qy 5161 AAC AGC AGT GGAAT AAGT AC T T AGAAAT GT GAAAAAT GAGC AGT AAAAT AGAT GAGAT AA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AGT GGAAT AAGTAC T TAGAAAT GTGAAAAAT GAGC AGT AAAAT AGAT GAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGATAG TC AAT TC T TGC C T TAT AC C T C AGT C TAT T C T G T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 5221 AGAAC T AAAGAAAT T AAGAGATAG TC AAT TC T TGC C T TAT AC C T CAGT C TAT TC T G T AAA 5280 

Qy 5281 AT T T T TAAAGAT ATATGC ATAC C T GGAT T TCC T TGGC T TC T T T GAGAATGT AAGAG AAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T TTAAAGATATATGCATACCT GGAT TTCC T TGGC T TC T TTGAGAATGTAAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

Qy 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGC TGC AGTC ACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C T C TAAAGAT G T AGGGAAAAGTGAGAGAGGGG T GAGGGTG T GGGGC TCC GGG T GAG AGT G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTG AGC TGGGGC AT TT TGGGC TTTGGGAAAC TGC AGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 
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Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5 674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 


RESULT 2 
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XX 

AC AAX84113; 
XX 

DT 08-SEP-1999 (first entry) 
XX 

DE MAGE-1 gene. 
XX 

KW Tumour rejection antigen; vaccine; cancer; MAGE-1 gene; ss. 
XX 

OS Homo sapiens . 
XX 

PN US5925729-A. 
XX 

PD 20-JUL-1999. 
XX 
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XX 

PR 23-MAY-1991; 91US-00705702 . 

PR 09-JUL-1991; 91US-00728 838 . 

PR 23-SEP-1991; 91US-00764 365 . 
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XX 

PA (LUDW-) LUDWIG INST CANCER RES. 
XX 

PI Van Der Bruggen P, Traversari C, Lurquin C, Boon T, De Plaen E; 

PI Van Pel A, Chomez P, Van Den Eynde B; 

XX 

DR WPI; 1999-418294/35. 
XX 

PT New tumour rejection antigen is useful as a vaccine against cancerous 

PT diseases. 

XX 

PS Disclosure; Col 39-46; 58pp; English. 
XX 

CC This sequence represents the MAGE-1 gene sequence. The invention relates 

CC to a tumour rejection antigen sequence that is useful as a tumour 

CC rejection antigen for vaccination against cancerous conditions 
XX 

SQ Sequence 5674 BP; 1276 A; 1644 C; 1569 G; 1185 T; 0 U; 0 Other; 

Query Match 100.0%; Score 5674; DB 2; Length 5674; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5674; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I 

Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 
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Qy 121 C T C TC AAC C C AGGGAAGC C C AGGT GC C C AGAT GT GAC GCC AC TGACT T GAGC AT T AGTGG 180 

I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCAC TGACT TGAGCATTAGTGG 180 

Qy 181 T T AGAGAGAAGC GAGGT T T TCGGT C TGAGGGGC GGC T TGAGATC GGTGGAGGGAAG C GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 181 T T AGAGAGAAGC GAGGT T T TCGGT C T GAGGGGC GGC T T GAGATC GGTGGAGGGAAG C GGG 240 

Qy 241 C C C AGC T C T G T AAGG AGGC AAGGT GAC AT GC T GAGGGAGGAC TGAGGACC C AC T T AC C C C 300 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 C C C AGC T C T GT AAGG AGGC AAGGT GAC AT GC T GAGGGAGGAC TGAGGACC C AC T T AC C C C 300 

Qy 301 AGAT AGAGGAC C C C AAATAATC CC T T CAT GC C AGT C C TGGAC C ATC TGGTGGT GGAC T T C 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 AGATAGAGGAC C C C AAATAATC CC T T CAT GC C AGT C C TGGAC C ATC TGGT GGT GGAC T T C 360 

Qy 361 TC AGGC T GGGC C AC C C C C AGC C CC C T T GC TGC T TAAAC C AC T GGGGAC TC GAAGT C AGAG 420 

I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CAT GC T C AGGAT TC T C AAGGAGGGC T GAGGGT C C C T AAGAC C C C AC T C CC GT GAC C C AAC 540 

I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 CAT GC T C AGGAT T C T C AAGGAGGGC T GAGGGT C C C T AAGAC C C C AC T C CC GTGAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ' 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IE I I I I I I I I I I II I I I I I I I 

Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I II I I I I I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I II 

Db 721 C C AGGAAAC AT C C GGGT GC C C GGATGTGACGC C AC T GAC T T GC G CAT T GT GGGGC AGAGA 780 

Qy 781 GAAGC GAGGT T T C C AT TC T GAGGGACGGC G T AGAGT T C GGC C GAAGGAAC C TGACC C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M II I I I I I I I I I I 

Db 781 GAAGC GAGGT T T C CAT T C T GAGGGACGG C GTAGAG T T C GGC C GAAGGAACC T GACC C AGG 840 

Qy 841 C T C TGTGAGGAGGC AAGGT GAGAGGC T GAGGGAGGAC T GAGGAC C C C GC C AC TC C AAAT A 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 

Db 841 C T C TGT GAGGAGGCAAGGT GAGAGGC TGAGGGAGGAC T GAGGAC C C C GC C AC T C C AAAT A 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CG T C T C AGCC T GGGC TGC C C C C AGACC C C TGC T C C AAAAGC C T T GAGAGAC AC C AGGT TC 1020 

I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 C GTC TC AGCC T GGGC TGCC C C C AGACC C C TGC T C C AAAAGC C T T GAGAGAC AC C AGGTT C 1020 

Qy 1021 TTC TCCC CAAGCTC TGGAATCAGAGGT T GC TGT GAC CAGGGCAGGAC T GGT T AGGAGAGG 1080 
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II 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1021 T TC TC C C C AAGC T C T GGAATCAGAGGT T GC TG TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGT T TGC C C C T GC T C T C AACC C AGGGAAGC C C T GGT AGGC C C GAT GT GAAAC C AC T GAC T 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 T GAAC C T C AC AGAT C T GAGAGAAGC C AGGT T C AT T T AAT GGT T C T GAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T GAAC C T C AC AGAT C T GAGAGAAGC CAGG T TC AT T T AAT GGT T C T GAGGGGC GGC T TGAG 1500 

Qy 1501 ATC C AC T GAGGGGAG T GGT T T T AGGC T C T GTGAGGAGGC AAGGT GAGATGC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 ATC C AC T GAGGGGAG T GGT T T T AGGC T C T GTGAGGAGGC AAGGT GAGATGC T GAGGGAGG 1560 

Qy 1561 AC T GAGG AGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GATC C AGT ACC AC C C C T GC T G 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GATC C AGTACC AC C C C T GC T G 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGT C AGGAGAG GC AGGGC C C AGGC AT C AAGGT CCAGC ATC CGCCC GGC AT TAGGGT CAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GGT C AGGAGAGGC AGGGC CC AGGC ATC AAGGT CCAGC ATC CGCCC GGC AT TAGGGT CAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 ACC CTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCT CATC TCCACCGCCACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
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Db 1921 T C AAC C C AC GGAAGC CAC GGGAAT GGC G GC C AGGC AC T C GGAT C T T GAC GTC C C C ATC CA 1980 

Qy 1981 GGG TC T G ATGGAGGGAAGGGGC TT GAAC AGGGC C TC AGGGGAGC AGAG GGAGGGC C C T AC 2040 

I I I E I E I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GGG TC TGATGGAGGGAAGGGGC TTGAACAGGGCC TC AGGGGAGC AGAGGGAGGGCCC TAC 2040 

Qy 2041 TGCGAGATGAGGGAGGCCTCAGAGGACCCAGCACCC TAGGACACCGCACCCC TGTC TGAG 2100 

I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I 

Db 2041 TGCGAGATGAGGGAGGCCTCAGAGGACCCAGCACCC TAGGACACCGCACCCC TGTC TGAG 2100 

Qy 2101 AC T GAGGC T GC CAC T T C T GGC C TC AAGAATC AGAAC GAT GGGGAC T C AGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 AC T GAGGC TGC CAC T T C TGGC C TC AAGAATC AGAAC GAT GGGGAC T C AGAT T GC AT GGGG 2160 

Qy 2161 GTGGGAC CC AGGC C TGCAAGGC TT ACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGACC T T 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 GTGGGAC CC AGGCC T GCAAGGC TT ACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGAC C T T 2220 

Qy 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 GGAAT C C AGAT C AGT GTGG AC C TC GGC C C TGAGAGG TCC AGGGC AC GG TGGC CAC AT AT G 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I 

Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2 340 

Qy 2341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 T C AGG TC AAC AGAGGGAGGAGT TC C AGGATC C ATAT GGC C CAAGAT GT GC C C C C T T CAT G 2400 

Qy 24 01 AGG AC TG GGGAT AT C C C C GGC TC AGAAAGAAGGGAC TCC AC AC AGT C T GGC TGTCCCCTT 2 460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 01 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 24 60 

Qy 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGAT GGGG TCTT GGGG TAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGG TAAAGGGGGGATGTCT 2580 

Qy 2581 AC T CATG TCAGGGAAT TGGGGGTT GAGGAAGC AC AGGCGC TGGC AGGAATAAAGAT GAGT 2 64 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 AC T CATG TCAGGGAAT TGGGGGTT GAGGAAGC AC AGGCGC TGGC AGGAATAAAGAT GAGT 2640 

Qy 2641 GAGAC AGAC AAGGC TAT T GGAATC C AC ACC C C AGAAC CAAAGGGGT C AGC C C T GGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 GAGAC AGAC AAGGC TAT T G GAATC CAC ACC C C AGAAC CAAAGGGGT C AGC C C T GGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GTCCC AGGATC TGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCC AG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2821 GTCCC AGGATC TGCCATGCGTTCGGGTGAGGAAC AT GAGGGAGGACTGAGGGT ACC CC AG 2880 
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Qy 2881 GAC C AGAAC AC TGAGGGAGAC TGC AC AG AAAT C AGC CCTGCCCC TGC T GTC AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GAC C AGAAC AC TGAGGGAGAC TGC AC AG AAAT C AGC CCTGCCCCTGC T GTC AC C C C AGAG 2940 

Qy 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I 1 I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 AC GGGGAGGC C T T GG T C T GAGAAGGCTGC GC T C AGG TC AG T AGAGGGAGC GT C CC AGGC C 3060 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C TGC C AGGAGT C AAG G T GAGGAC C AAGC GGGC AC C T C AC C C AGGAC AC AT T AAT T C C AAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 C TGC C AGGAGT CAAGGT GAGGAC C AAGC GGGC ACC T C AC C C AGGAC AC AT T AAT T C C AAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

E I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I f I I I I I I I I I I I I I I I I I I 
Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 C T T C C TGGAGC T C C AGGAAC C AGGC AGT GAGGC C T T GGT C T GAG AC AG T ATC C TC AGGT C 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 C T T C C TGGAGC T C C AGGAAC CAGGC AGT GAGGC C T T GGT C T GAG AC AG T ATC C TCAGGT C 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 AC AGAGC AGAG GAT G C AC AGGGTG TGC C AGC AG T GAATG T T TGC C C TGAATGC AC AC C AA 3540 

Qy 3541 GGGC C CC AC C T GC C AC AGGAC AC AT AGG AC TC C AC AGAG T C T GGC C T C AC C T C C C T AC TG 3600 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I 
Db 3541 GGG C C CC AC C T GC CAC AGG AC AC AT AGGAC TC C AC AGAGT C T GGC C T C ACC T C C C T AC T G 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 C C T T C AGG T T T TC AGGGGAC AGGC C AAC C C AG AGGAC AGGAT TC C CT GGAGGC CAC AGAG 3720 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 CC T T C AGGT T T TC AG GGGAC AGGC C AAC C C AG AGGAC AGGAT T C C C T GGAGGC CAC AGAG 3720 

Qy 3721 GAGCACCAAGGAGAAGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTC 3780 

I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGCACC AAGGAGAAGATC TGTAAGTAGGCCT T TGT TAGAGTC T CCAAGGTT CAGT TC TC 3780 
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Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I II I I 11 I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C C AC AC TCCTGCCTGCTGCC C TG AC GAGAGT C ATC ATGT C TC T T GAGC AGAGGAG 3900 

I I I I I I I I I I I I 1 I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 C C T GC C C AC AC TCCTGCCTGCTGCCC TG AC GAGAGT CATC AT GT C TC T T GAG C AGAGGAG 3900 

Qy 3901 T C T GC AC TGC AAGCC TGAGGAAGC C C T T GAGGC C C AAC AAGAGGC CC T GGGC C T GG T GTG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 T C T GCAC TGC AAGCC T GAGGAAGC C C T T GAGGC C C AAC AAGAGG C CC T GGGC C T GG T GTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 C AC T GC T GGGT C AAC AGAT CC T C C C C AGAGTC C TC AGGGAGC CTCCGCCTTT C CC AC T AC 4080 

I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I 
Db 4021 C AC T GC T GGGT C AAC AGAT CC T C C CC AGAG TC C T C AGGGAGC CTCCGCCTTTCC C AC TAC 4080 

Qy 4081 CAT C AAC T TC AC T CGAC AGAGGC AAC C C AG TGAGGG T T C C AGC AGCC G T GAAGAGGAGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I 
Db 4081 CAT C AAC T TC AC T CGACAG AGGC AAC C C AGT GAGGG T T C C AGC AGCC G T GAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 42 60 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4201 TGATTTGGTTGGTTTTC TGC TCCTCAAAT ATC GAGC C AGGGAGC CAGTCACAAAGGCAGA 42 60 

Qy 4261 AAT GC T GGAGAGTGT C AT C AAAAAT T AC AAGC AC TGTTTTCC TGAGAT C T T C GGC AAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AAT GC TGGAGAGT GT C AT C AAAAAT TAC AAGC AC T G T T T T CC TGAGAT C T T C GGC AAAGC 4320 

Qy 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 4321 C TC T GAG TC C T T GC AGC TGGTCTTT GGC AT T GAC GT GAAG GAAGC AGACC C C AC C GGC C A 4380 

Qy 4 381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 44 40 

Qy 4441 GATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGG 4500 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GAT CAT G C C C AAGAC AGGC T T C C T GAT AAT T G T C C T GGT C AT GAT TGC AAT GGAGG GC GG 4 500 

Qy 4 501 C CAT GC T C C TG AGGAGGAAATC TGGGAG GAGC T GAG T GT GAT GGAGGT GT ATGAT GGGAG 4 560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 4 501 C C ATGC T C C T G AGGAGGAAAT C TGGGAGGAGC TGAG T G TGAT GGAGGT GT AT GATGGGAG 4 560 

Qy 4561 GGAGC AC AG T GC C TAT GGGGAGCC C AGGAAGC T GC T C AC C C AAGAT T T GGTGC AGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4561 GGAGC AC AGTG C C TAT GGG GAGCC CAGGAAGC T GC T C AC C C AAGAT T T GGTGC AGGAAAA 4620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4 740 
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I I I I II I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 4741 GC AAGAG TTCGCTTTTTCTTCC C ATC C C TGC G TGAAGC AGC T T T GAGAGAGG AGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1 t I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCTTCC C ATC C C TGC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I 
Db 4801 GGAGT C T GAGC AT GAGT T GC AGCC AAGGC C AGTGGG AGGGGGAC TGGGC C AG T GCAC C T T 4860 

Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I 
Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4921 GAAGAGAGC GG T C AGT GT T C TC AG T AGT AGG TTTCTGTTC TAT T GGGT GAC T TGGAGAT T 4 980 

I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 4921 GAAGAGAGC GG T C AGT GT T C TC AG T AGT AGG TTTCTGTTC TAT T GGGT GAC T T GGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5041 T T C AGC AT C C AAGT T TAT GAAT GAC AGC AGT C AC AC AGT T C T GT GT AT AT AG T T TAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

Qy 5161 AAC AGC AG T GGAAT AAG T AC T TAGAAAT GT GAAAAAT GAG C AG T AAAAT AGAT GAGAT AA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AACAGCAGTGGAATAAGTACTTAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGAT AG T C AAT TC T T GCC T TAT AC C T C AGTC T AT T C T G T AAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC T AAAGAAAT T AAGAGAT AG T CAAT T C T T GC C T TAT AC C T C AGTC TAT TC T G T AAA 5280 

Qy 5281 AT T T T T AAAGAT ATAT GC AT AC C T GGAT T T C C T TGGC T T C T T T GAGAAT G T AAGAGAAAT 5340 

I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T T AAAGAT ATAT GC AT AC C T GGAT T T C C T TGGC T T C T T T GAGAATG T AAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 54 01 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGC TGC AGTC ACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGC AGTC ACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C T AAAGATG T AGGGAAAAG T GAGAGAGGGG TGAGGGT G T GGGGC T C C GGG T GAG AGTG 5580 

I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 5521 CTC TAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGC TCCGGGTGAGAGTG 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I II I I I I I I I I I I I I I I I I I I II I I I 
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Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 


Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I II I I I I I I I I I I M I I I I I I I I I I I I II I I 

Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

RESULT 3 
AAQ32352 

ID AAQ32352 standard; DNA; 5674 BP. 
XX 

AC AAQ32352; 
XX 

DT 25-MAR-2003 (revised) 

DT 22-APR-1993 (first entry) 

XX 

DE MAGE-1 nucleic acid. 
XX 

KW melanoma antigen; MAGE TRA; melanoma antigen tumor rejection antigen; 

KW tumor rejection antigen precursor; MAGE; antigen E; gene family; ss. 
XX 

OS Homo sapiens . 
XX 

FH Key Location/Qualifiers 

FT CDS 3881. .4711 

FT /*tag= a 
XX 

PN WO9220356-A1. 
XX 

PD 2 6-NOV-1992. 
XX 

PF 22-MAY-1992; 92WO-US004 354 . 
XX 

PR 23-MAY-1991; 91US-00705702 . 

PR 09-JUL-1991; 91US-00728838 . 

PR 23-SEP-1991; 91US-00764364 . 

PR 12-DEC-1991; 91US-00807043 . 
XX 

PA (LUDW-) LUDWIG INST CANCER RES . 
XX 

PI Boon T, Van Der Bruggen P, Van Den Eynde B, Van Pel A, De Plaen E; 

PI Lurquin C, Chomez P, Traversari C; 

XX 

DR WPI; 1992-415460/50. 
XX 

PT Nucleic acid mol . encoding a human tumour rejection antigen precursor - 

PT useful as an immuno stimulant in a vaccine for treating and preventing 

PT cancers, also useful in diagnosis. 
XX 

PS Disclosure; Page 71-73; 142pp; English. 
XX 

CC The sequences given in AAQ32352-69 represent a new family of genes 

CC refered to as melanoma antigens (MAGE). The cDNAs of this gene family 

CC were identified during the isolation of the antigen E gene. The MAGE 

CC cDNAs, when tested, did not transfer expression of antigen E, but they 

CC did show substantial homology to the antigen E cDNA sequence. The MAGE 

CC DNAs share a certain degree of homology with each other and are expressed 

CC in tumour cells including several types of human tumor cells as well as 

CC in human tumors. MAGE expression is not restricted to melanomas. MAGE 

CC refers to a family of tumor rejection antigen precursors. The antigens 

CC resulting from these genes are referred to as MAGE TRAs or melanoma 
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CC antigen tumor rejection antigens. See also AAQ32351. (Updated on 25-MAR- 

CC 2003 to correct PN field.) 

XX 

SQ Sequence 5674 BP; 1277 A; 1644 C; 1568 G; 1185 T; 0 U; 0 Other; 

Query Match 99.9%; Score 5672.4; DB 2; Length 567 4; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 567 3; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 C T C TC AAC CC AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC TG AC T T GAGC AT TAGT GG 180 

I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 1 I I I I I I 
Db 121 C T C TC AAC CC AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC TG AC T T GAGC AT TAGT GG 180 

Qy 181 TTAGAGAGAAGCGAGGTTT TCGGTCTGAGGGGCGGC TTGAGATCGGTGGAGGGAAGCGGG 240 

I It I I I I I I I I I I I I I I I II I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 T TAGAGAGAAG CGAGGT T T T C GGT C TGAGGGGC GGC T T GAGAT C GGT G GAGG GAAGC GGG 240 

Qy 241 CC C AGC T C TGT AAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC C C AC T T AC CC C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CC C AGC T C T GT AAGGAGGC AAGGT GAC ATGC T GAGGGAGGAC T GAGGAC C C AC T T AC C C C 300 

Qy 301 AGAT AGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGAC CATC TGGTGGTGGACTTC 360 

I I I I I I I I IE I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATC TGGTGGTGGACTTC 3 60 

Qy 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 C T C C GT G TGAT C AGGGAAG GGC TGC T TAGGAGAGGGC AGC G T C C AGGC T C T GC C AGAC AT 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGC TGC TT AGGAGAGGGC AGC GTCC AGGC TCTGCC AGAC AT 480 

Qy 481 CAT GC T C AGGAT T C TC AAGGAGGGC TGAGGGT C CC T AAGAC C C C AC TC C C GT GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CATGCTCAGGATTCTCAAGGAGGGCTGAGGGTCCCTAAGACCCCACTCCCGTGACCCAAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I II I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 C CAGGAAAC AT C C GGGTGC C CGGATGT GAC GC C AC T GAC T TGC G C AT TGT GGGGC AGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 C CAGGAAAC AT C CGGG TGC C C GGAT GT GAC GC C AC T GAC T T GC GC AT TG T GGGGC AGAGA 780 
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Qy 781 GAAGCGAGGT T TC C AT TC T GAGGGAC GGC GT AGAGT TC GGCC GAAGGAAC C T GAC C C AGG 840 

I I I E I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I E I I I I I I I I I I I I I I I I I I I E I 
Db 781 GAAGCGAGGT T TC C AT TC T GAGGGAC GGC GT AGAGT TC GGCC GAAGGAAC C T GAC C C AGG 840 

Qy 841 C TC TG T G AGGAGGC AAGGT GAGAGGC T GAGGGAGGAC TGAGGAC C C C GC C AC T C C AAATA 900 

I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

Qy 901 GAGAGCC CCAAATAT TCCAGCCCCGCCC TTGC TGCC AGCCCTGGCCC ACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GAGAGCCCCAAATAT TCCAGCCCCGCCC TTGC TGCC AGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 C GT C T C AGC C T GGGC TGC C C C CAG AC C C C TGC T CC AAAAGC C T T GAGAGAC AC C AGGT TC 1020 

I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CG T C T C AGCC T GGGC TGC C C C CAG AC C C C TGC T CC AAAAGC C T T GAGAGAC AC C AGGT TC 1020 

Qy 1021 T T C T C C C C AAGC T C T GGAATC AGAGGT T GC TG TGAC C AGGGC AGGAC T GG T T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1021 T T C T C C C C AAGC T C T GGAATC AGAGGT T GC TG TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1261 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 1381 GGT TTGC CCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACT GAC T 1440 

Qy 1441 TGAACCTCACAGATCTGAGAGAAGCCAGGTTCATTTAATGGTTCTGAGGGGCGGCTTGAG 1500 

I I I I I I I I I I I I I I I I I I I I I I E I I I I E I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I 
Db 1441 T GAAC C T C AC AGAT C TGAGAGAAGCC AGGT T CAT T T AAT GGT TC TGAGGGGC GGC T T GAG 1500 

Qy 1501 AT C C AC T GAGGGGAG T GGT T T TAGGC TC T GT G AGGAGGC AAGG T GAGATGC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1501 AT C C AC T GAGGGGAG T GGT T T TAGGC T C T GT GAGGAGGC AAGGT GAGATGC T GAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAATG ATC C AGT ACC AC C C CT GC T G 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1561 AC T GAGGAGGC AC AC AC C C C AGGT AGAT GGC C C CAAAATGAT C C AGT ACC AC C C C T GCTG 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I 1 I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I 
Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I 
Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGG TC T G ATGGAGGGAAGG GGC T T GAAC AGGGC C T C AGGGGAGC AGAGGGAG GGC C C T AC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1981 GGG T C T GAT GGAGGGAAGG GGC T T GAAC AGGGCC T C AGGGGAGC AGAGGGAGGGC C C T AC 2040 

Qy 2041 T GC GAGAT GAGGGAGGCC T C AGAGGACC C AGC AC C C T AGGAC AC C GC AC CCCTGTCT GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2041 T GC GAGAT GAGGGAGGCC T C AGAGGAC C C AGC AC C C T AGGAC AC C GC AC CCCTGTCT GAG 2100 

Qy 2101 AC T GAGGC TGC CAC T TCTGGCC TC AAGAATCAGAAC GATGGGGAC TCAGAT TGC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC T GAGGC T GC CAC T T C T GGC C TC AAGAATCAGAAC GATG GGGAC TCAGAT T GC AT GGGG 2160 

Qy 2161 G T GGGAC C C AGGC C T GC AAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC T C AG GGGAC C T T 2220 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GT GGGAC C C AG GC C T GC AAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC T C AG GGGAC C T T 2220 

Qy 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAAT C C AGAT C AGT GTGGAC C T C GGC C C T GAGAGG T C C AGGGC ACGG T GGC CAC AT AT G 2280 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 GCC CAT ATT TCC TGC ATCTTTGAGGTGAC AGGAC AG AGC TGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2 341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 T C AGGTC AAC AGAGGGAGGAG T T C C AGGAT C CAT AT GGC C C AAGATG T GC C C C C T T CAT G 2 4 00 

Qy 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2401 AGGAC T GGGGAT AT C C C C GGC T C AGAAAGAAG GGAC TC C AC AC AG TC T GGC TGTCCCCTT 2460 

Qy 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 24 61 T TAG TAG C T C T AGGG GGAC C AGAT C AGGGAT GGC GG TATG T T C C AT T C TC AC T T GT ACC A 2520 

Qy 2521 C AGGC AGGAAGTTGGGGGGCCCTCAGGGAGAT GGGG TCTT GGGG TAAAGGGGGGATGTCT 2580 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGG TAAAGGGGGGATGTCT 2580 

Qy 2581 AC TCATG TCAGGGAATTGGGGGTT GAGGAAGC ACAGGCGC TGGC AGGAATAAAGAT GAGT 2 640 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 2581 AC T C ATG TC AGGGAAT T GGGGGTT GAGGAAGC AC AGGC GC T GGC AGGAAT AAAGAT GAGT 2640 

Qy 2641 GAGAC AG AC AAGGC TAT TGGAATC C AC AC C C C AGAAC C AAAGGGGTC AGC CC TGGAC AC C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GAGAC AG AC AAGGC TAT T GGAATC C AC AC C C C AGAACC AAAGGGG TC AGC CC TGGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I M 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

Qy 27 61 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 CAT T C TC AGAGGG TGAC T C AGGTC AAC G TAGGGAC C C C CAT C TGGTC T AAAGAC AGAGC G 2820 

Qy 2821 G T C C C AGGATC TGCC ATGC GT TCGGGTGAGGAAC AT GAGGGAGG AC T GAGGGTAC C C C AG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2821 GTC CCAGGATC TGCCATGC GT TCGGGTGAGGAACAT GAGGGAGGACTGAGGGTACC CCAG 2880 

Qy 2881 GAC C AGAAC AC TGAG GGAGAC TGC AC AGAAAT C AGC CCTGCCCCTGC T GT C AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2881 GAC C AGAAC AC TGAGGGAGAC TGC AC AGAAAT C AGC CCTGCCCCTGC T GT C AC C C C AGAG 2940 

Qy 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I 
Db 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 AC GGGGAGGC C T T GG T C TGAGAAGGC T GC GC T C AGG T C AG T AGAGGGAGC GT C C C AGGC C 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 AC GGGGAGGC C T TGG T C TGAGAAGGC T GC GC T C AGG T C AG TAGAGGGAGC GT C CC AGGC C 3060 

Qy 3061 C TGCCAGGAGT CAAGGTGAGGACC AAGC GGGC ACC T CAC C CAGGACAC AT TAAT TC CAAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 C T GC C AG GAGT CAAGGTGAGGACC AAGC GGGC AC C T CAC C CAGGACAC AT T AAT TC C AAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 ACC AGCAAAAGGGCAGGAT CCAGGCCC T GCCAGGAAAAAT ATAAGGGC CC TGCGTGAGAA 3300 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I II I I I 

Db 3241 AC CAGCAAAAGGGCAGGAT CCAGGCCC TGCCAGGAAAAATATAAGGGCCC TGCGTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GT AGC AC T GAG AAGC CAGG GC T GT GC T T GC GGT C T G CAC C C T GAGGGC C C GT GGAT T CC T 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCT TGGTC TGAGACAGTATCCTCAGGTC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCT TGGTC TGAGACAGTATCCTCAGGTC 3480 

Qy 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 
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Qy 3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 3541 GGGC C C C AC C T GC C AC AGG AC AC AT AGGAC TC C AC AGAGT C T GGC C T C AC C T CC C T AC TG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 CC T TCAGGT T T TCAGGGGACAGGC CAAC CCAGAGGACAGGAT TC CCTGGAGGCCAC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 3661 CC T TCAGGTT T TCAGGGGACAGGC CAAC CCAGAGGACAGGAT TC CC TGGAGGCCAC AGAG 3720 

Qy 3721 GAGC AC C AAGG AGAAGATC T GT AAGTAGGC C T T T GT TAGAGTC T C C AAGGT T C AGT TC TC 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGC AC C AAGG AGAAGATC TGTAAGTAGGCC T T TGT TAGAGTC T CC AAGGT T CAGT TC TC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C C AC AC TC C T GCC T GC TGC C C T GAC GAGAGT C ATC AT GT C T C T T GAG C AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 C C T GC C C AC AC TC C T GC C T GC TGC C C T GAC GAGAGT CATC AT GT C T C T T GAGC AGAGGAG 3900 

Qy 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 T C T GC AC T GC AAGC C TGAG GAAGC C C T T GAGGC C C AAC AAGAGGC C C T GGGC CTGGTGTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 C AC TGC T GGGT C AAC AGAT C C TC C C C AGAG T C C TC AGGGAGC C T C CGC C T T T C C C AC T AC 4080 

Qy 4081 CAT CAAC T T C AC T C GAC AGAGGC AAC C C AG TGAGGGT T C C AGC AGC C G T GAAGAGG AGGG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 4081 CAT CAAC T T C AC T C GAC AGAGGC AAC C C AGTGAGGG T T C C AGC AGC CG T GAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 42 61 AATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AAT GC T GGAGAG TGT C ATC AAAAAT TAC AAGC AC T G T T T T C C TG AGAT C TT C GGC AAAGC 4320 

Qy 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4 380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4 381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 44 40 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 
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Qy 4441 GAT C ATGC C C AAGAC AGGC T TC C T GATAAT TG T C C T GGTC ATGAT TGC AAT GGAGGGC GG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I 

Db 4 441 GAT C AT GC C C AAGAC AGGC T T C C T GATAAT TG T C C T GGTC ATGAT TGC AAT GGAGGGC GG 4 500 

Qy 4501 CCATGC T CCTGAGGAGGAAATC TGGGAGGAGC TGAGTGTGATGGAGGTGTATGATGGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4501 C CAT GC T C C TG AGGAGGAAATC TGGGAGGAAC TGAG TG T GAT GG AGGT GT ATGATGGGAG 4560 

Qy 4561 GGAGC AC AGTG C C TAT GGGGAGCC CAGGAAGC T GC T C AC C C AAG ATT T GGTGC AGGAAAA 4620 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4561 GGAGC AC AGTGC C TAT GGGGAGCC CAGGAAGC T GC T C AC C C AAG ATT T GGTGC AGGAAAA 4 620 

Qy 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

Qy 4741 GC AAGAG TTCGCTTTTTCTTCC C ATC C C TGC G T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4741 GC AAGAG TTCGCTTTTTCTTCC C ATC C C TGC GT GAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I 

Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 48 60 

Qy 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I 

Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4 921 GAAGAGAGC GG TC AG T GT T C TC AG T AGT AGGT TTCTGTTC TAT T GGGT GAC T TGGAGAT T 4 980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 4 921 GAAGAGAGC GG T C AG T GT T C TC AG T AGT AGG TTTCTGTTC TAT T GGGT GAC T TGGAGAT T 4 980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5101 T AAG AGT CTTGTGTTT TAT T C AGAT T GGGAAATC C AT TC TAT T T TG T GAAT T GGGATAAT 5160 

Qy 5161 AAC AGC AG TGGAATAAGTAC T T AGAAAT GTGAAAAAT GAGC AGT AAAAT AGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5161 AAC AGC AG T GGAAT AAGT AC T T AGAAAT GTGAAAAAT GAG C AGT AAAATAGAT GAG AT AA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGATAG T CAAT T C T TGC C T TAT AC C T C AGT C TAT T C TG TAAA 5280 

I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 5221 AGAAC T AAAGAAAT T AAGAGATAG T CAAT T C T TGC C T TAT AC C T C AGT C TAT T C TG TAAA 5280 

Qy 5281 AT T T T TAAAGAT ATAT GC AT ACC T GGAT T TC C T TGGC T T C T T T GAGAATGT AAGAG AAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5281 AT T T T TAAAGAT ATAT GC ATAC C T GGAT TTCCTTGGCTTCTTT GAGAATGT AAGAG AAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 


http://es/ScoreAccess\Veb/GetItem.action?AppId=088 19669&seqld=6095 1 7&ItemName=us.. 


I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I 1 I I I I I II I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TC T GC T T T T TGGAAG GC C C TGGGT T AGT AGTGGAGAT GC T AAGG T AAGC C AGAC T CAT AC 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCC TGGGT TAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 C T C T AAAGATGTAGGGAAAAGTGAGAGAGGGG TGAGGGT G TGGGGC T C C GGG TGAGAGTG 5580 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C T C T AAAGATGTAGGGAAAAGTGAGAGAGGGG TGAGGGTG TGGGGC T C C GGG T GAG AGT G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGC TGGGGC AT TTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGC AT TTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 
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DR WPI; 1995-283606/37. 
XX 

PT New monoclonal antibody binding specifically to MAGE-1 - useful for 

PT diagnosis and monitoring of cancer, also new hybridomas, recombinant MAGE 

PT -1 and immunogenic peptide (s). 

XX 

PS Disclosure; Page 16-19; 33pp; English. 
XX 

CC A monoclonal antibody directed against the tumour rejection antigen (MAGE 

CC -1) can be used to detect MAGE-1 in samples by standard immunoassay 

CC methods for diagnosis and monitoring of cancer etc. The monoclonal 

CC antibody is designated MA454 and is produced by the hybridoma deposited 

CC as ATCC HBB11540. The monoclonal antibody is specific for MAGE-1, having 

CC no reactivity for MAGE- 2 or MAGE- 3 . Peptide fragments of MAGE-1 (See 

CC AAR80618-20) may be useful as immunogens for production of the monoclonal 
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XX 

SQ Sequence 5724 BP; 1282 A; 1653 C; 1589 G; 1200 T; 0 U; 0 Other; 

Query Match 99.6%; Score 5650.8; DB 2; Length 5724; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 5652; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I 
Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 C T C TC AAC C C AGGGAAGC C C AGG T GCC C AGAT GTGACGC C AC T GAC T T GAGC AT T AGT GG 180 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 C TC TC AAC C C AGGGAAGC C C AGGT GCC C AGAT G TGACGC C AC T GAC T T GAGC AT TAG T GG 180 

Qy 181 T TAGAGAGAAGC GAGGT T T T C GGT C TGAGGGGC GGC T TGAGAT C GGT GGAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 T TAGAGAGAAGC GAGGT T T T C GGT C TGAGGGGC GGC T TGAGATC GG T GGAGGGAAGC GGG 240 

Qy 241 C C C AGC T C T G T AAGG AGGC AAGGT GAC ATGC T GAGGGAGGAC TGAGGACCC AC T T ACC C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 C C C AGC T C T G TAAGGAGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC C C AC T TAC C CC 300 

Qy 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AGAT AGAGGAC C C C AAATAATC C C T TC AT GC C AGT C C T GGAC C ATC T GGT GG TGGAC T TC 360 

Qy 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 T C AGGC T GGGC C AC C C C C AGC CCCCTTGCTGCT TAAAC C AC T GGGGAC T C GAAG T C AGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CAT GC T C AGGAT TC T CAAGGAGGGC TGAGGGT C C C T AAGAC C C C AC T C C CG T GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 481 CAT GC TC AGGAT TC T CAAG GAGGGC TGAGGGT C C C T AAGACC CC AC T CC C GT GACC C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
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Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I i I 

Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I 

Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 C C AGGAAAC AT C C GGGT GC C C GGAT GTGAC GC C AC T GAC T T GC G CAT T GTGGGGC AGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I II I I I I I I I 

Db 721 C C AGGAAAC AT C C GGGT GC C C GGAT GT G ACGC C AC T GAC T TGC G CAT T GTGGGGC AGAGA 780 

Qy 781 GAAGC GAGGT T TC C AT TC T GAGGGAC GGC GT AGAGT T C GGC CGAAGGAAC C T GAC C C AGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GAAGC GAGGT T TC C AT T C T GAGGGAC GGC GT AGAGT T C GG C CGAAGGAAC C T GAC C C AGG 840 

Qy 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CTC TGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCAC TCCAAATA 900 

Qy 901 GAGAGC C C C AAATAT TC C AGC CCCGCCCTTGC TGC C AGC C C T GGCC C AC C C GC GGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 9 61 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

Qy 1021 T T C TC C C C AAG C T C T GGAAT C AGAGGT T GC T G TGAC C AGGGC AGGAC T GGT T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1021 T T C TC C C C AAGC T C T GGAAT C AGAGGT T GC T G TGAC C AGGGC AGGAC T GG T T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GGTTTGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCACTGACT 1440 

Qy 1441 TGAAC C T C AC AGATC T GAGAGAAGCC AGGT T C AT T T AAT G GT TC TGAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 TGAACC TC AC AGATC TGAGAGAAGCCAGGTTCAT T TAATGGT TC TGAGGGGC GGC T TGAG 1500 
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Qy 1501 ATC CAC T GAGGGGAGTGGT T TTAGGC TC TGTGAGGAGGCAAGGTGAGATGC TGAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 ATC CAC T GAGGGGAGTGGT T TTAGGC TC TGTGAGGAGGCAAGGTGAGATGC TGAGGGAGG 1560 

Qy 1561 AC T GAGG AGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GATC C AGT AC CAC CC C T GC T G 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AC T GAGG AGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GATC C AGTAC C AC CC C T GC T G 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I 1 I I 

Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 CAC TGC C AC T T AAC C C AC AGGGCAATC T GTAGT C AT AGC T TATG TGAC C GGGGC AG GGT T 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 AC C C T GGGAGGGAAC T GAGGGTT C C CC AC C CAC AC CTGTCTCCT CAT C T C C ACC GC CAC C 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 ACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCCACC 18 60 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGGTC TGATGGAGGGAAGGGGCT T GAAC AGGGCC TCAGGGGAGC AGAGGGAGGGCC C TAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGGTC TGATGGAGGGAAGGGGCTTGAAC AGGGCC TCAGGGGAGC AGAGGGAGGGCC C TAC 2040 

Qy 2041 T GC GAGATGAGGGAGGC C T C AGAGGAC C C AGC AC C C T AGGAC AC C GC AC CCCTGTCT GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 TGCGAGATGAGGGAGGCCTCAGAGGACC CAGC ACCCTAGGACACCGCACCCC TGTC TGAG 2100 

Qy 2101 AC T GAGGC T GC CAC T T C TG GC C TC AAGAAT C AGAAC GAT G GGGAC TC AGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC T GAGGC T GC CAC T TC T GGC C T CAAGAATC AGAAC GAT G GGGAC TC AGAT T GC AT GGGG 2160 

Qy 2161 GT GGGAC C C AGGC C T GC AAGGC T TAC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GT GGGAC C C AGGCC T GC AAGGC T TAC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T 2220 

Qy , 2221 GGAAT C C AGAT C AG T GT GG AC C TC GGC C C TGAGAGGT C C AGGGC AC GG TGGC CAC AT AT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAATC C AGAT C AGT GTGGAC C T C GGC C C TGAGAGGT C C AGGGC AC GG T GGC CAC AT AT G 2280 

Qy 2281 GCC CAT AT TTCC TGC ATC TTTGAGGTGAC AGGAC AGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCC CAT AT TTCC TGC ATC TTTGAGGTGACAGGAC AGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2400 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 TCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATG 2 400 
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Qy 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

I I I I t I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2401 AGGACTGGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTT 2460 

Qy 2461 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I 
Db 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCT 2580 

Qy 2581 AC T C ATG TC AGGGAAT TGGGGGTT GAGGAAGC AC AGGC GC TGGC AGGAAT AAAGAT GAGT 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AC T C ATG T C AGGGAAT TGGGGGTT GAGGAAGC AC AGGC GC TGGC AGGAAT AAAGAT GAGT 2640 

Qy 2641 GAGAC AGAC AAGGC TAT T GGAATC C AC ACC C C AGAAC C AAAGGGGT C AGC C C T GGAC AC C 2700 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2 641 GAG AC AGAC AAGGC TAT T GGAATC C AC AC C C C AGAAC C AAAGGGGT C AGC C C T GGAC ACC 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 27 60 

Qy 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I 
Db 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

Qy 2821 GT C CC AGGAT C T GC C ATGC GT T CGGGTGAGGAAC AT GAGGGAGGAC T GAGGG T ACC C C AG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 GT C C C AGGAT C T GC C ATGC GT TCGGGT GAGGAAC AT GAGGGAGGAC T GAGGG TAC C C C AG 2880 

Qy 2881 GAC C AGAAC AC T GAG GGAG AC TGC AC AGAAAT C AGC CCTGCCCC TGC T GT C AC C C C AGAG 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I i I I I I I I I I I I I I I 

Db 2881 GAC C AGAAC AC T GAGGGAGAC T GC AC AGAAATC AGC CCTGCCCCTGCT G TC AC C C C AGAG 2940 

Qy 2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I II I I I I I I I I I I I I I I I I I 

Db 2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

Qy 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

Qy 3061 C T GC C AGGAGT C AAGGTGAGGAC C AAGC GGGC AC C T C AC C C AGGAC AC AT TAAT TC C AAT 3120 

I I I I I I I I I I I I I I I I I II I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 C TGCCAGGAGT CAAGGTGAGGACC AAGC GGGC ACC TC ACC C AGGAC AC AT TAAT TC CAAT 3120 

Qy 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 GAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTT 3180 

Qy 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

Qy 3241 ACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 ACC AGC AAAAGGGC AGGAT CCAGGCC C T GC C AGGAAAAAT AT AAGGGC C C TG C GTGAGAA 3300 

Qy 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

Qy 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I i I I I I 
Db 3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

Qy 3421 C T T C C T GGAGC TC C AGGAACC AGG C AGT GAGGC C T T GGTC T GAG AC AG TAT C C T C AGGT C 3480 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

Qy 3481 AC AGAGC AGAGGAT GC AC AGGGTG TGC C AGC AGT GAAT GT T T GC C C T GAATGC AC AC C AA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 AC AGAGC AGAG GATGC AC AGGGTG TGC C AGC AG T GAATGT T T GC C C T GAATGCAC AC C AA 3540 

Qy 3541 GGGC CC C AC C T GC C AC AGG AC AC AT AGG AC T C C AC AGAGT C T GGC C T C AC C T C C C T AC TG 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 GGGC C C C AC C T GC C AC AGGAC AC ATAGGAC T C C AC AGAGT C T GGC C T C AC C T C C C T AC TG 3600 

Qy 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

Qy 3661 C C T TC AGGT T T TC AGGGGAC AGGC CAAC C C AG AGGAC AGGAT TC C C TGGAGGC C AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 CC T TCAGGT T T TCAGGGGACAGGC CAAC CC AG AGGAC AGG AT TC CC TGGAGGCCAC AGAG 3720 

Qy 3721 GAGC AC C AAGGAGAAGAT C TGT AAG TAG GC C T T TGT T AGAG T C T C C AAGGT T C AGT T C T C 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 GAGC AC C AAGGAGAAGAT C TGT AAGT AGGC C T T TGT TAGAG T C T CC AAGGT T C AGT T C T C 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C C AC AC T C C T GC C T GC T GC CC T GAC GAGAG T CAT CAT GT C TC T TGAGC AGAGGAG 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 CCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAG 3900 

Qy 3901 TC T GC AC TGC AAGC C T GAG GAAGC C C T T GAGGC C C AACAAGAGGC C C T GGGC C TGG T GT G 3960 

I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 T C T GC AC T GC AAGC C TGAGGAAGC C C T T GAGGC C C AACAAGAGGC C C T GGGC C T GG T GT G 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3961 TGT GC AGGC TGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 CACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTAC 4080 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 C AC TGC T GGGT C AAC AGAT C C TCC C C AGAGT C C T C AGGGAGC C TCCGCCTTTCC C AC TAC 4080 

Qy 4081 CAT CAAC T TC AC TC GAC AG AGGC AAC C C AGT G AGGG T TC C AGC AGC C G TGAAGAGGAGGG 4140 

I I I I I I I I I I 11 I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 4081 CAT CAAC T T C AC TC GAC AG AGGC AAC C C AGT G AGGG T T C C AGCAGC C G T GAAG AGG AGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTC TGC TCC TCAAATATC GAGC C AGGGAGC C AGT C AC AAAGGCAGA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I 
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Db 4201 TGATTTGGTTGGT TT TC TGC TCC T C AAAT ATC GAGC C AGGGAGC C AGT C AC AAAGGC AGA 4260 

Qy 4261 AAT GC TGGAGAG T GT C ATC AAAAAT T AC AAGC AC TGTTTTCC TGAGAT C T T C GGC AAAGC 4320 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AAT GC TGGAGAG T GT CATC AAAAAT T AC AAGC AC TGTTTTCC TGAGAT C T T C GGC AAAGC 4320 

Qy 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I 
Db 4321 C T C T GAG T C C T T GC AGC TGGT C T T TGGC AT TGAC G T GAAGGAAGC AGAC C C C AC C GGC C A 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GAT C ATGC C C AAGAC AGGC T T C C T GAT AAT TG T C C T GGTC AT GAT T GC AATGGAGG GC GG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GAT C ATGC C C AAGAC AGGC T T C C T GAT AAT TG T CC T GGT C AT GAT T GC AATGGAGGGC GG 4500 

Qy 4501 C CAT GC T C C TG AGGAGGAAAT C TGGGAGGAGC T GAG TGTGAT GGAGGT G T ATGATG GGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4501 CCATGCTCCTGAGGAGGAAATC TGGGAGGAGC TGAGTGTGATGGAGGTGTATGATGGGAG 4560 

Qy 4 561 GGAGC AC AGTGC C TAT GGGGAGC C C AGGAAGC T GC T CAC C C AAGAT T T GGTGC AGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 561 GGAGC AC AGTGC C TAT GGGGAGC C C AGGAAGC T GC T CAC C CAAGAT T T GGTGC AGGAAAA 4 620 

Qy 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4 680 

Qy 4 681 C C AAGGG C C C T C GC T GAAAC C AGC TAT G TGAAAGT C C T T GAG TAT GT GAT C AAGGT C AG T 4 740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 681 CC AAGGGCCCTCGCT GAAAC C AGC TATGTGAAAGTCCTTGAGTATGTGATC AAGGT C AGT 4 740 

Qy 4 741 GC AAGAG TTCGCTTTTTCTTCC C ATC C C T GCG T GAAGC AGC T T T GAGAGAGGAGGAAGAG 4 800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 741 GC AAGAG TTCGCTTTTTCTTCC CAT C C C TGCG T GAAGCAGC T T T GAGAGAGGAGGAAGAG 4 800 

Qy 4 801 GGAG TC T GAGC ATGAGT TG C AGC C AAGGC C AG T GGGAGGGGGAC T GGGC C AGT GC ACC T T 4 8 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 4 861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4861 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4921 GAAGAGAGC GG T C AG T GT T C T C AG TAGT AGGT TTCTGTTC TAT T GGGT GAC T T GGAGAT T 4980 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGC GG T C AG T GT T C T C AG T AG T AGGT TTCTGTTC TAT T GGG T GAC T T GGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 T T C AGC ATC C AAGT T T ATGAAT GAC AGC AGTC AC AC AGT T C T GT G TAT AT AG T T T AAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 TAAGAGT C T T G TGT T T TAT T C AGAT TGGGAAAT C CAT T C TAT T T T GT GAAT T GGGATAAT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAAT 5160 
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Qy 5161 AAC AGC AGT GGAAT AAGT AC T TAG AAAT GT GAAAAATGAGC AGT AAAAT AGATGAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AG T GGAAT AAGT AC T T AGAAAT GTGAAAAATGAGC AGT AAAAT AGATGAGATAA 5220 

Qy 5221 AGAAC TAAAGAAAT T AAGAGAT AG TC AAT TC T TGC C T TAT AC C T C AG T C TAT TC TG T AAA 5280 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 1 I I II I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC TAAAGAAAT T AAGAGAT AG TC AAT TC T TGC C T TAT AC C T CAGT C TAT TC TG T AAA 5280 

Qy 5281 AT T T T TAAAGAT ATAT GC ATAC C T GGAT T TC C T TGGC T TC T T TGAGAATGT AAGAG AAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I 1 I I I 
Db 5281 AT T T T TAAAGAT ATAT GC ATAC C T GGAT T TC C T TGGC T T C T T T GAGAATGT AAGAG AAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

Qy 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 54 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 01 TC T GC T T T TTGGAAGGCCC TGGGT TAGT AGTGGAGATGC T AAGGTAAGCC AGAC TC AT AC 54 60 

Qy 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5461 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 C T C TAAAGAT G T AGG GAAAAG TGAGAGAGGGG TGAGGGT G T GGGGC T C CGGGT GAGAGT G 5580 

Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTG 5654 

I I I I I I I I I I II 
Db 5641 GGGGGAGCTGGCTG 5654 
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XX 

PI Kipps TJ, Wu Y; 
XX 

DR WPI; 1998-583198/49. 
XX 


PT Generating cellular immune response in patient to target protein - 

PT comprises introducing vector with nucleotide sequence encoding immunogen 

PT comprising protein processing signal into cell of patient. 

XX 

PS Disclosure; Col 35-44; 61pp; English. 
XX 

CC This invention describes a novel method for generating a cellular immune 

CC response in a patient to a target protein or its fragment. The method 

CC involves introducing a vector containing a nucleotide sequence encoding a 

CC chimeric immunogen comprising a protein processing signal and the target . 

CC protein or its fragment. The immunogen is produced by the cells and 

CC processed so that the target protein or its fragment is presented to the 

CC patients immune system and a cellular immune response is initiated. The 

CC method and vectors can be used as a form of vaccination and could be used 

CC to generate a cellular immune response in patients to, e.g. cancerous 

CC tumours. The cellular immune response is the predominant immune response 

CC in the patient. This sequence represents a DNA fragment which encodes the 

CC human tumour antigen MAGE-4a described in the method of the invention. 

CC Note: The information in this spec has been previously disclosed in 

CC W019 984 544 4 however this spec contained no sequence information 

XX 

SQ Sequence 11495 BP; 2530 A; 3788 C; 2924 G; 2253 T; 0 U; 0 Other; 

Query Match 46.8%; Score 2655; DB 2; Length 11495; 

Best Local Similarity 73.6%; Pred. No. 0; 

Matches 4231; Conservative 0; Mismatches 1100; Indels 416; Gaps 50; 

Qy 21 CCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCCATCCAAACATCTTCACGCTC 80 

I I I II I I I I I I I I I I I I I I I I I I I 

Db 5969 CCAGCACCCCTATCCTCCCCAAACCCCCACTACCCTTATGTCCTCATCCCCCACCCCAAC 6028 

Qy 81 ACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTGCTCTCAACCCAGGGAAGC-C 139 

I I I I I I I I I I I I I I I I I I I MM M I M M M M M M M M I I 

Db 6029 ACCACTATCCCCATCCAGGTTGAATCGCATTCCGTTTCTGCTTTCAACCCAGGGAAGCTC 6088 

Qy 140 C AGGTGC C C AGAT G T GAC GC C AC T GAC T TGAG CAT T AGTGGTT AGAGAGAAG C GAGGTT T 199 

M M I M M M M I MM M M M I M M I I I M M M M M M M M 
Db 6089 C AGGT TC C T GGATGT GAT GC C AGT GAC T TGTGC AT T GGGGGT T AGAGAGAC GC TAG C T T C 6148 

Qy 200 TCGGTCTGAGGGGCGGCTTGAGATCGGTGGAGGGAAGCGGGCCCA-GCTCTGTAAGGAGG 258 

M M I M I Ml II I I I III II II II I I I I I II III I II I I I I III II 
Db 6149 TCAGTCTGACAGGCAGCTTGGGATTGGCAGAGGGAAGCCGGTCCAGGCTCTGTGAGGTGG 6208 

Qy 259 CAAGGTGACAT GC TGAGGGAGGAC T GAGGAC CCACT TACCCC AGAT AGAGGACC CCA 315 

II I I I I I I I I I II I I I I I I I I II I I II I I I II I I I I I I I I I I I I 

Db 6209 C AT AGTG AGAAGC T G AGGGAGAAG T CGG GAGGCC C T C T C C ACC C C AGATAGAC GAC C C C A 62 68 

Qy 316 AATAATCC CTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTCTCAGGC 366 

I II I I I I I II I I I I I I II II I I I I I I I I II I I I II I I I I 

Db 6269 AATAATCCGGCACCCCTCCTGCTTCCAGTCCTGGGCCACCCGTGGGCGGACTTCTGAGTC 6328 

Qy 367 TGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAGCTCCGT 42 6 

II I I I II I I II II I I I II I II I I I I II I I I II I I I I I I II 

Db 6329 TGGGACGCCCACCACCCCACTGCCGCTGAAGCCGCAGGGACTATGGAGTCAGAGCTTGGT 6388 
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Qy 427 GTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACATCATGCT 486 

I I I I I I I I I I I I I II I II I I M I I I I I I I I I I I I I I 

Db 6389 GTGATCAGTGCAGGACTGGTGGGGGT AGGCTCTGCCAGGCATCAACGT 64 36 

Qy 487 C AGGAT T C T C AAGGAGGGC TGAGGGTC C C T AAGACC CC AC TC C C GT GAC CC AAC C C C C AC 546 

I I I I I II I I I I I I I I I I I I I I I I I I I I II III I I I I 

Db 6437 C AGGAC C C T AGGAGAGGGC TGAGT GTCC C C C A CCCCCATTCCTATCCCCTACCCCTT 64 93 

Qy 547 TCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCACCCCAC 606 

I I I I I I I I I I I I III I I I I I 

Db 64 94 TCCCATCTGCACTCCC TACCCCATCTGTACCCCC 6527 

Qy 607 ATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCTCACCCC 666 

I I I I I I I I I III III II II I I I I I I I I I I I I I I 

Db 6528 ATTCCCCACCTGTGCCCCTATCCTCCCCAACCCCCCAACCAGCCTCATACCCCCCTCCCC 6587 

Qy 667 CACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCG-GTTCCCGCCAGG 725 

I I I I I I II I II I I I I I I II I II Ml I I I I I 

Db 6588 CACCCCTACCTTCATCCCCATCAGTGCAGCATCCGGTTCCACCCCTGCTTTCAATCCAGG 664 7 

Qy 726 AAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGAGAAGC 785 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 

Db 6648 C AAGC C C T GGG TGGC C GGATGT GATGC C AC TG AC T T GT GAAT T GAGGG T TAG AGAGAAGT 6707 

Qy 786 GAG GT T T C C AT TC T GAGGG AC GGC GT AGAGT T C GGC C GAAGGAAC C TGACC C AGGC T C TG 845 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 6708 GAGTTTCTGGGTCTGAAGGGTGGC-TTGAGATCGGCAGAGGGAAGGTGGCCCAGGCTTTG 67 66 

Qy 846 TGAGGAGGC AAGGT GAGAGGC T GAGGGAGGAC TGAGGAC C CC GC C AC T C C AAAT AGAGAG 905 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 6767 TGAAGAGGCAAAGTGAGAC TC TGAGGGAGGAT TC AGGAAACCCC TATC CCTGATAGAGGG 6826 

Qy 906 CCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGACGTCT 965 

I I I I I III I I I I I I I I I I I 

Db 6827 TCCCAGCCCTGGACTACCC CGCGGAGGCTGACTTCT 68 62 

Qy 966 C AGC C TG GGC T GC C C C C AGAC C C C TGC T C C AAAAGC C T T G AGAGAC AC C AGG TTCTTCTC 1025 

I I I I II I I I I I I I I I I I I I I I II I II 

Db 6863 CAGACTGGGCTGCTCCCCACCTCCGCCCCC TTCGC AAC GCGT T TGT T T AAGCC AC 6917 

Qy 1026 CC C AAGC T C TGGAAT C AG AGGT TGC TGT GAC CAGGGC AGGAC TGGTT AGGAGAGGGC AGG 108 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 

Db 6918 AGGGGACTCTGGAGTCAGAGGTTGGTGTGATCAGGGAAGGGCTGGTTAGGAGA-GGCATG 697 6 

Qy 1086 GCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCCCCAAG 1145 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6977 GC C C AGGC C C T GC C AGGAATC AAAGTC AGAAAC C - T GAGAGGGAAC TGAGGT C C C C C AAG 7035 

Qy 114 6 ACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACCCCCAT 1205 

I I II II I I I I I I I I I I I I 

Db 7036 ATCCTAGTCTAACCCCCACTCCCACAA 7062 

Qy 1206 CTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACCACCCT 1265 

I I I I III I I I I I I I II I I I I I 

Db 7063 ATCCGCTGCCATTTCGCTGCTCCATTTCCCATTCCTTGCCCT 7104 

Qy 1266 CCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAACCCCAC 1325 

III II II II 

Db 7105 CCACCCTCACCA 7116 

Qy 132 6 CCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCCGGTTT 1385 
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1 1 1 1 1 1 1 1 1 1 III 

Db 7117 GGCAGAATCCAGTTC 7131 

Qy 1386 GC C - C C TGC TC T C AACC C AGGGAAGCC C T GG T AGGC C C GAT G T GAAACC AC T GAC T TGAA 1444 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7132 CCCTTCTGCTATCAATCCAGGGAAACCCCAGGCTTGGTGCTGGGATGTTTTT 7183 

Qy 1445 C C T C AC AGATC T GAG AGAAGC C AGGT T C AT T T AATG GT T C T GAGGGGC GGC T TGAG ATC C 1504 

I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 7184 T GGGGGTC AGAGAAT C AAGGGC AT AGTC C T GAGGGGCC AGT T GAGATC G 7232 

Qy 1505 AC T GAGGGGAG T GG T T T TAGGC TC TG T GAGGAGGC AAGGT GAGATGC T GAGGGAGG AC T G 1564 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7233 GC T GAGGGGAGC GGGCC C AAGC TC TGT GGC GAGGC AAGGT GAGAC T C T GAGGAAGG AC T G 7292 

Qy 1565 AGGAGGC AC AC AC C C C AGG T AGAT GGC C CC AAAATGATC C AGTACC AC C C C T GC T GC C AG 1624 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7293 AGGAGGC C C C C AC C C AAGAT AGA- GGAAC C C AAATAAT C C AGC GC AGC T C C TG C T GC C AG 7351 

Qy 1625 CCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCCCACT 1684 

I I I I I I I I I I II I I II III I II 1 I III II I I I I I I I I 

Db 7352 TCCTGGACCACCCGG GGGAAGACTTCTCA GGCTAGGCCATCCCAGCTCCCACT 7404 

Qy 1685 GCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTTGGTC 1744 

I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 7405 GC C AC T AAAGC TAC AGGGGAC T C T AGAG TC AAGAGC T TGG T GTGCC C A 7452 

Qy 174 5 AGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGGACCC 1804 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7453 AGGCAGGGCCCAGGC TCTGCCTGGCATCGGGGTCAGGACCT 74 93 

Qy 1805 T GGGAGGGAAC T GAGGGT T C C C C AC C C AC AC CTGTCTCCT CAT C T C C AC C GC C AC C C C AC 1864 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M 

Db 7494 T GAGAGGGAAC T GAG GGC GC TACACC C C C AC C C CAT C C GC ATT C CAACAT 7543 

Qy 18 65 TCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTGTCAA 192 4 

III I I I I I I I I I I I II II III I I I I I I I I I I I 

Db 7544 GCCCAGCCCCATCCCCAACTCCGTTTTGCAGAATCCATTTTT TCCCCTGCAGTCAA 7599 

Qy 1925 C C C AC GGAAGC C AC GGGAAT GGC GGC C AGGC AC T C G GATC T TGAC GTC C C CAT C C AGGGT 1984 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I 

Db 7 600 CCCCGGGAAGACCTGGGAATGGT C AGGC AC T C GGAT C T TGAC AT C C AC ATC GAGGGC 7 65 6 

Qy 1985 CTGATGGAGGGAAGGGG CTTGAACAGGGCC TCAGGGGAGCAGAGGGAG 2032 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7657 TGAAGGAGGGAGAGGGT T T GGTAT CAT G AGC AGAGC C T C AGGGT AGC AGAGGGAGGACC C 7716 

Qy 2033 - GGC C C TAC T GC GAGATG AGGGAGGC C T CAGAGGAC C CAGC AC CC TAGGAC 2082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 7717 T GGCC C T C C T GGGAGAT GAGGAAGGC C T C AGGAGAC C CAGC AC C C C AAGGCAGGGAGC CC 7776 

Qy 2083 ACCGCAC CCC TGTC T GAGAC TGAG — GC TGC C AC T TC TGGC C T C AAGAAT C AGAAC GAT G 214 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 7777 AC CC C AC CC C T GTC T GAGAATGAGGTGC CTCCTCTTT TAGC C TC AGGAAT C C AAGGGATG 7836 

Qy 2141 GGG AC T C AGAT TGC AT — GGGGGT GGGACC C AGGC C TGC AAGGC T TAC GC G GAGGAAGAG 2198 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 7837 GCAACTCAGGTCAGCAGAGGGGTGGGTTCCAAGCCCTTCCAGGATCAAGGAAAGGAAGAC 7896 

Qy 2199 GAGGGAGGACTCAGGGGACCTTGGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTC 2258 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I 
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Db 7897 GAGGGAGGAT TC AGGGGGC C T T GC AT TC C AGAT C AG TGGAGAC C T GGGC C C T GGGAGGTC 7956 

Qy 2259 CAGGGCACGGTGGCCACATATGGCCCATATTTCCTGCATCTTTGAGGT GACAGGAC 2314 

I I I I I I III I I I I I I I II I I II I I I I I I I I I I I I I I I I I II I I I I 

Db 7957 C TGGGC AAGGT AGC C AC C T GT AGC TC AT AC T T CC T GC AT C T T C GAGGT C AC AGAGAGGAG 8016 

Qy 2315 AGAGC TG T GGTC TGAGAAG TGGGG C C TC AGG T C AAC AGAGGGAGGAGT TC C AGGAT C C AT 2374 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8017 AGGGC TAT GGT C TGAGGGG TGGTAC T T C AGGT C C GC AGAGGGAGGAGT C C C AGGAT C TAC 807 6 

Qy 2375 ATGGCCCAAGATGTGCC-CCCTTCATGAGGACTGGGGATATCCCCGGCTCAGAAAGAAGG 2433 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 8077 AGGAC CC AAGGTGTGCC AC AC T TC ACGAGGAATGGGGAT AC C TG T GGC TC AGAAAGAC GG 8136 

Qy 2434 GAC TCC ACACAGTC TGGC TGTCCC C TT T TAGTAGC T C TAGGGGGACCAGATC AGGGATGG 2493 

III I I I I I I I II I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8137 GAC C C C AC AGAGTC T GGC TGTCCCCTGTTC T T AGC T C AGGGGGGAC C AGAGGAGGGATGG 8196 

Qy 2494 CGGTATGTTCCATTCTCACTTGTACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATG 2553 

I I I I I I III I I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I I I I I I I I I 
Db 8197 CC C TATG T GC C AAT T TC AC T TGT T C C AC AGGC AGGAAGT T GGGGAAC C T T C AGGGAGAT G 8256 

Qy 2554 GGGTCTTGGGGTAAAGGGGGGATGTCTACTCATGTCAGGGAATTGGGGGTTGAGGAAGCA 2 613 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8257 AGGTTTTGGAGTAAAGGGGCAATGTTTGCTCATCTCAGGGGGTTGGGGGTTGAGGAAGGG 8316 

Qy 2614 C AG GC GC T GGC AGGAATAAAGAT GAGTGAGAC AGAC AAGGC TAT TGGAATC C AC AC C C C A 2 67 3 

I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 
Db 8317 C AGGC CC T G TC AGGAGCAAAC AT GAGT - AC C C AC AGG AGGC C ATC AGAACC C T C AC C C C A 8 37 5 

Qy 2674 GAAC C AAAGGGGT C AGC C C TGGAC ACC T C AC C C AG GATGTGGCTTCTTTTTC 2725 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8376 GAACCAAAGGGGTCAGCCCTGGGCACCCCACACAGGGGTGACAGGATGTGGCTCCTTCTC 8435 

Qy 272 6 ACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCTCATTCTCAGAGGGTGACTCAGGTCA 2785 

I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8436 AT T T C TGAT T C C AGATC T C AG T GAGGT GAGGAC CTTGTTCT C AGAGGG TGAC TC AGGT C A 8495 

Qy 2786 ACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCGGTCCCAGGATCTGCCATGCGTTCGG 2845 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I 
Db 8496 CC AC AGGGAC C C C CAT C TGGTC TAC AGAC AC AGT GG T C C C AGGAT C T GC C AAGAGT C C T G 8555 

Qy 2846 GT GAGGAAC AT GAGGGAGGAC TGAGGGT AC C C C AGG AC C AGAAC AC TG AGGGAGAC T GC A 2905 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III II 
Db 8556 G T GAGGAAT GTGAGGGAGGAT TGAGGGT ACC ACAGGGC C AGAAC GC AGAT GAT GAC C C C A 8615 

Qy 2906 CAGAAATCAGCCCTGCCCCTGCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAG 2965 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I III I I I I I III 
Db 8616 C AGAAAT C AGC CCTGCTCCTGTTGT C AC C C C AGAGAGC AT GGGC T TGGC T TT C T GC T GAG 8 675 

Qy 2966 GTCCTTCCGTTATCCTGGGATCATTGATGTCAGGGACGGGGAGGCCTTGGTCTGAGAAGG 3025 

I I I I II I I I I I I I I I I I I I I II I I I I I III I I I I I I I I I I I I I I I I I I II 
Db 8676 GTC CC TC TC T T ATCC TGGGATC AC TGGT GTC ACGGAGTGGGAGGCC T T GGTC TGAGGGGG 8735 

Qy 3026 C T GC GC T CAGGT CAG TAGAGGGAGC GT C CCAG GC C C TGC C AGGAG TC AAGGT GAGGAC C A 3085 

I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 87 36 CTGCACCCAGGTCAGTAGAGGGAGGGTCCCAGGCTCTGCCAGGAGTTGAGGTGAGGACCA 8795 

Qy 308 6 AGC GGGC AC C T C AC C C AGGAC ACAT T AAT TCC AATG AAT T T T GAT AT CTCTTGCTGCCCT 314 5 

III III II II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 8796 AGCAGGCTCCGCATCCAGGACACATGGGTTCCAATGAATTTCGACATCTTTTGCTGTCGT 8855 
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Qy 314 6 TC-CCCAAGGACCTAGGCACGTGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCT 3204 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 8856 TCTTCGGAAGACCTAGGCACAGGTGGCCAGATGTGGGGTTTCTTAGGTCCT GTTCCC 8912 

Qy 3205 TATCATGGATGTGAAC TCT TGATT TGGAT T TC TCAGACCAGCAAAAGGGCAGGATCC AGG 32 64 

I III I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I MINIMI 
Db 8913 TCTCAGGCATGTGAGCTCTTGATCTGAGTTTCTCAGGCCAGCAAAAGAGTGGGATCCAGG 8 972 

Qy 32 65 CCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCCACTGCATGA 3324 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I II I I I I I 
Db 8973 CCCTGCCTGGAGAAATGTGAGGGCCCTGAGTGAACACAGTGGGGATCATCCACTCCATGA 9032 

Qy 3325 GAG TGGGGATG TC AC AGAG T C CAGC C C AC C C T C C T GGTAGC AC T GAGAAGC C AGGGC TGT 3384 

I I I I II I I I I I II I I I I I I I I I I I I I I I II II I I I I I I I I I II I I I I I I I 

Db 9033 GAG TGGGGAC C TC AC AGAG TC CAGC C T AC C C T C T T GAT GGC AC T GAGGGAC C GGGGC TGT 9092 

Qy 3385 GCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCAGGAACCAGG 3444 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II 
Db 9093 GC T T AC AGT C T GC AC C C TAAGGGC C C AT GGAT TCCTCTCC T AGGAGC T C C AGGAAC AAGG 9152 

Qy 3445 CAGTGAGGCC T TGGTC TGAGACAGTATC C TCAGGTC AC AGAGCAGAGGATGC ACAGGGTG 3504 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 
Db 9153 CAG TGAGGCC T TGGTC TGAGACAGTGTC C TCAGGT T AC AGAGCAGAGGATGC AC AGGCTG 9212 

Qy 3505 TGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAGGACACA 3564 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9213 TGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAAGACACA 9272 

Qy 3565 T AGGAC T C C AC AGAGTC TGGC C TC AC C T C C C T AC TGT CAG T C C T GT AGAATC GAC C T C T G 3624 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I Ml I I I I I I I I I I I I I I I I I I I 

Db 9273 T AGGAC TCCAAAGAGTCTGGCCTC AC CTCCCTACCATCAATCCTGC AGAATC GACCTCTG 9332 

Qy 3625 CTGGCCGGCTGTACCCTGA-GTACCCTCTCACTTCCTCCTTCAGGTTTTCAGGGGACAGG 3 683 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 9333 CTGGCCGGCTATACCCTGAGGTGCTCTCTCACTTCCTCCTTCAGGTTCTGAGCAGACAGG 9392 

Qy 3684 C C AAC C C AGAG GAC AGGAT T C C C T GGAGGC C AC AGAGGAGC AC C AAGGAGAAGAT C TGT A 3743 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9393 C C AAC C G - GAGGAC AGGAT T C C C TGGAGGC C AC AGAGGAGC AC C AAGGAGAAGAT C TGT A 9451 

Qy 3744 AGT AGGC C T T T GT TAGAGT C T C C AAGGT TC AG T TC T CAGC TGAGGC C T C T C AC AC AC T C C 3803 

I I I I I I I I II I II I I I I III III II I I I I I I I I I I I I I I I I I IE I I I I I I I 
Db 94 52 AGT AAGC C T T T GT TAGAGC C T C T AAGAT T T GG T TC T CAGC T GAGGTC TCT C AC AT GC T C C 9511 

Qy 3804 CTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTG 38 63 

I I II I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I Mill I I I I II I I I 

Db 9512 CTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCCAGCTTTTGCCTGCACTCTTGCCTGCTG 9571 

Qy 38 64 C C C TGAC GAG AGT CATC AT GT C TC T TGAGC AGAGGAGT C T GC AC T GC AAGC C T GAGGAAG 3923 

II I I I I I I I I I II I I I I I I 11 I II I I I II I I I I I I I II I I I I I I I I I I II I II I I 

Db 9572 C C C TGAC C AGAG T CATC AT GT C T T C T GAGC AGAAGAGT CAGC AC TGC AAGC C T GAGGAAG 9631 

Qy 3924 CCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I III I I I I II I II 
Db 9632 GCGTTGAGGCCCAAGAAGAGGCCCTGGGCCTGGTGGGTGCACAGGCTCCTACTACTGAGG 9691 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGC 4019 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II 
Db 9692 AGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTCTGGTCCCTGGCACCCTGGAGGAAGTGC 9751 
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Qy 4020 CCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTA 407 9 

I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9752 CTGCTGCTGAGTCAGCAGGTCCTCCCCAGAGTCCTCAGGGAGCCTCTGCCTTACCCACTA 9811 

Qy 4080 C C ATC AAC T TC AC TC GAC AGAGGC AAC C C AG T GAGGGT T C C AGC AGC C GT GAAGAGGAGG 4139 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9812 C CATC AGC T TC AC T T GC T GGAGGC AAC C C AAT GAGG GT T C C AGC AGC C AAGAAGAGGAGG 9871 

Qy 4140 GGC C AAGC AC C T C T T GTAT C C T GGAGTC C T TG T T C C GAGC AGT AAT C AC T AAGAAGGTGG 4199 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9872 GGCCAAGCACCTCGCCTGACGCAGAGTCCTTGTTCCGAGAAGCACTCAGTAACAAGGTGG 9931 

Qy 4200 CTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAG 4259 

III I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9932 ATGAGT T GGC T CAT T T T C T GC TC C GCAAGT ATC GAGC CAAGGAGC TGG T C AC AAAGGC AG 9991 

Qy 42 60 AAAT GC T GGAGAGT G TC AT C AAAAAT TACAAGCAC TGTTTTCCT GAGATC T T C GGC AAAG 4 319 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 
Db 9992 AAAT GC T GGAG AGAG TC AT C AAAAAT TAC AAGC GCTGCTTTCCT GT GATC T T C GGC AAAG 10051 

Qy 4320 C C TC TGAGT C C T T GC AGC T GG T C T T T GGC AT TGACG TGAAGGAAGC AG AC C C C ACC GGC C 4379 

I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 10052 C C TC C GAGT C C C T GAAGAT GATC T T TGGC AT T GAC G TGAAGGAAGT GGAC C C C GCC AGC A 10111 

Qy 4380 ACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATC 4439 

II I I I I I I I I I I I I I I I I LI I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10112 ACACCTACACCCTTGTCACCTGCCTGGGCCTTTCCTATGATGGCCTGCTGGGTAATAATC 10171 

Qy 4440 AGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCG 4499 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 10172 AGATCTTTCCCAAGACAGGCCTTCTGATAATCGTCCTGGGCACAATTGCAATGGAGGGCG 10231 

Qy 4500 GCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGA 4559 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10232 ACAGCGCCTCTGAGGAGGAAATCTGGGAGGAGCTGGGTGTGATGGGGGTGTATGATGGGA 10291 

Qy 4 560 GGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAA 4 619 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10292 GGGAGCACACTGTCTATGGGGAGCCCAGGAAACTGCTCACCCAAGATTGGGTGCAGGAAA 10351 

Qy 4620 AGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGG 4678 

I I II I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 10352 ACTACCTGGAGTACCGGCAGGTACCCGGCAGTAATCCTGCGCGCTATGAGTTCCTGTGGG 10411 

Qy 4679 GTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCA 4738 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I III I I I I I 

Db 10412 GTCCAAGGGCTCTGGCTGAAACCAGCTATGTGAAAGTCCTGGAGCATGTGGTCAGGGTCA 10471 

Qy 4 739 G T GC AAG AGT TCGCTTTTTCTTCC C ATC CC TGC GT G AAGC AGC T T TGAGAGAGGAGGAAG 4798 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10472 ATGCAAGAGTTCGCATTGCCTACCCATCCCTGCGTGAAGCAGCTTTGTTAGAGGAGGAAG 10531 

Qy 4799 AGGGAGT C TGAGCAT GAGT TGCAGCCAAGGCC AGTGGGAGGG GGAC TGGGCC AGT G 4854 

M I I I I I I I II I I I I I I I I I I I I I I I I III I I I I II II I I I I I I I I I I I 

Db 10532 AGGGAGT CTGAGCATGAGTTGCAGCCAGGGCTGTGGGGAAGGGGCAGGGC TGGGCC AGTG 10591 

Qy 4855 CACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTT 4914 

II II II I II II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10592 CATCTAACA--GCCCTGTGCAGCAGCTTCCCTTGCCTCGTGTAACATGAGGCCCATTCTT 1064 9 

Qy 4915 CACTC TGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGA 4970 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


I I I t I I I I I I I I I I I I I I II I I I MINI I I I I I I I II I I I I I III 
10650 CACTCTGTTTGAAGAAAATAGTCAGTGTTCTTAGTAGTGGGTTTCTATTTTGTTGGATGA 10709 

4971 CTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGG 5030 

I I I I I I I I II I I I I I I I I I I I I II I I II I I I I I I I I II I I I I II I I I I I I 
10710 CTTGGAGATTTATCTCTGTTTCCTTTTACAATTGTTGAAATG-TTCCTTTTAATGGATGG 10768 

5031 TTGAATGAAC T TCAGCATCC AAGT T TATGAATGACAGCAGTCAC ACAGT TC TGTGTATAT 5090 

I I I I M I I I I I M I I I I I I I I I I I I I I I I II II I I I I II I I I I II 

10769 T TGAATTAAC T TCAGCATCCAAGT T TATGAATCGTAGT TAACGT ATAT TGC TGT TAATAT 10828 

5091 AGT T TAAGGGT AAGAGT CTTGTGTTT TAT T C AGAT T GGGAAAT C CAT T C TAT T T TG TGAA 5150 
I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
10829 AGT T TAGGAGT AAGAGT CTTGTTTTT TAT T C AGAT T GGGAAAT C CGT T C TAT T T TG TGAA 10888 

5151 TTGGG AT AAT AACAGCAG T GGAAT AAGT AC T T AGAAAT GT GAAAAAT GAGC AGT AAA 5207 

ii it 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 mill Mill! 1 1 1 1 mi i ii ii 

10889 TT TGGGACATAATAACAGC AGTGGAGTAAGTAT T TAGAAGTGTG AATTCACCGTGAA 10945 

5208 AT AGATGAGAT AAAG AAC T AAAGAAAT T AAGAGATAGT C AAT TC T T GC C T TAT AC C TC AG 5267 
I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I I I I I I I 

10946 ATAGGTGAGAT AAATTAAAAGATACTTAATTCCCGCCTTATGCCTCAG 10993 

52 68 TCTATTCTGTAAAATTTTTAAAGATATATGCATACCTGGATTTCCTTGGCTTCTTTGAGA 5327 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I II I I I I II I I I I I I I M 
10994 TC T AT TC TGTAAAAT TT AAAAAT AT AT ATGC ATACC TGGAT T TC C TTGGC T T C GTGA 11050 

5328 ATGTAAGAGAAATTAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTC 5387 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
11051 AT GTAAG AGAAAT TAAATC T GAAT AAAT AAT TCTTTCTGT T AAC TGGC T CAT TTCTTCTC 11110 

5388 C ATGC AC TGAGCATC TGC TTTTTGGAAGGCCCTGGGTTAGTAGTGGAG ATGC TAAGGTAA 5447 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I J I I I I I I I III I I I I I 
11111 TAT GC AC T GAG CATC TGC T C TGT G GAAGGC C C AGGAT TAG TAGT GGAG AT AC TAGGGTAA 11170 

5448 GC C AGAC T CAT AC C C AC CC AT AGGGT C G TAGAGT C T AGGAGC TGC AGT C AC G T AAT CGAG 5507 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
11171 GCC AGACACACACCTACCGATAGGGTAT TAAGAGTC TAGGAGCGCGGTCATATAATTAAG 11230 

5508 GTGGCAAGATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCT 5567 

III I I I I I I I I I I I I I I I I I II I I I I I I I III I I I I I I I I I I I 

11231 GT GAC AAGAT G T C C T C T AAGAT GT AGGGGAAAAGT AACGAGTGT GGGT ATGGGGC T 11286 

5568 CCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAAC 5627 

II I I I I I I I I I I I I I I I I I III I I I I I I I I II I I I II I I I I I I I I II I I I I I 
11287 CCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGTG-TGGGGCCTTTTGGGCTTTGGGAAAC 1134 5 

5628 TGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
11346 TGCATTTTCTTCTGAGGGATCTGATTCTAATGAAGCTTGGTGGGTCC 11392 


RESULT 6 
ABQ76204 

ID ABQ76204 standard; DNA; 4895 BP. 
XX 

AC ABQ7 6204; 
XX 

DT 21-OCT-2002 (first entry) 
XX 

DE Human tumour antigen MAGE-4b DNA. 
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XX 

KW Tumour antigen; human; vaccine; cellular immune response; immunogen; 

KW cancer; tumour; MAGE- 4b; ds . 

XX 

OS Homo sapiens . 
XX 

PN US6287569-B1. 
XX 

PD ll-SEP-2001. 
XX 

PF 06-APR-1998; 98US-00056105 . 
XX 

PR 10-APR-1997; 97US-00434 67P . 
XX 

PA (REGC ) UNIV CALIFORNIA. 
XX 

PI Kipps TJ, Wu Y; 
XX 

DR WPI; 1998-583198/49. 
XX 

PT Generating cellular immune response in patient to target protein - 

PT comprises introducing vector with nucleotide sequence encoding immunogen 

PT comprising protein processing signal into cell of patient. 

XX 

PS Disclosure; Col 45-50; 61pp; English. 
XX 

CC This invention describes a novel method for generating a cellular immune 

CC response in a patient to a target protein or its fragment. The method 

CC involves introducing a vector containing a nucleotide sequence encoding a 

CC chimeric immunogen comprising a protein processing signal and the target 

CC protein or its fragment. The immunogen is produced by the cells and 

CC processed so that the target protein or its fragment is presented to the 

CC patients immune system and a cellular immune response is initiated. The 

CC method and vectors can be used as a form of vaccination and could be used 

CC to generate a cellular immune response in patients to, e.g. cancerous 

CC tumours. The cellular immune response is the predominant immune response 

CC in the patient. This sequence represents a DNA fragment which encodes the 

CC human tumour antigen MAGE- 4b described in the method of the invention. 

CC Note: The information in this spec has been previously disclosed in 

CC W0199845444 however this spec contained no sequence information 

XX 

SQ Sequence 4895 BP; 1134 A; 1235 C; 1433 G; 1093 T; 0 U; 0 Other; 

Query Match 44.3%; Score 2513.6; DB 2; Length 4895; 
Best Local Similarity 79.9%; Pred. No. 0; 

Matches 3415; Conservative 0; Mismatches 694; Indels 165; Gaps 32; 

Qy 1478 AT GG TT C T GAGGGGC GGC T TGAGAT C C AC T GAGGGGAGT G GT T T T AGGC TC T GTGAGGAG 1537 

I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III 

Db 607 ATAGTCCTGAGGGGCCAGTTGAGATCGGCTGAGGGGAGCGGGCCCAAGCTCTGTGGCGAG 666 

Qy 1538 GC AAGGT GAGATGC T GAGGGAGGAC T GAGGAG GC AC AC AC CC C AGG T AGATGGC C C C AAA 1597 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II II II 

Db 667 GCAAGGT GAGAC TC T GAGGAAGGAC T GAGGAGGC CC C C AC C C AAGAT AGA- GGAAC CC AA 72 5 

Qy 1598 ATGATCCAGTACCACCCCTGCTGCCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAG 1657 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I 

Db 726 ATAATCCAGCCCACGTCCTGCTGCCAGTCCTGGACCACCCGG GGGAAGAC T T C TC A- 781 

Qy 1658 CTGGACCACCCCCCGTCCCGTCCCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATA 1717 
III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
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Db 782 GGC TAGGCC ATCC C AGC TCCC AC TGCC AC TAAAGC T AC AGGGGAC T C TAG AGTC A — 836 

Qy 1718 GCTTATGTGACCGGGGCAGGGTTGGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGC 1777 

I I I I II I I I I I I I I 

Db 837 AGAGCTTGGTGTGCCCAAGGCAGGGCCAGG 866 

Qy 1778 ATC C GCC C GGC AT T AGGGT C AGGACC C T GGGAGGGAAC TGAGGG T TC C C C AC C C AC AC C T 1837 

II III I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8 67 C T C TGCC T GGC AT C GGGGT C AGGACC T T GAGAGGGAAC TGAGGGC GC T AC AC C C CC AC C C 926 

Qy 1838 GTCTCCTCATCTCCACCGCCACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACC 1897 

I II I I I I I I I I I I I I I I I I I II 

Db 927 CATCCGCATTC CAACATGCCCAGCCCCATCCCCAACTCCGTTTTGCAGAA 97 6 

Qy 1898 TCATCTTGTCAGAATCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCAC 1957 

II HI | | | | | | I | | | I | I I I I I I I I I I I I I I II I I I I I I I 

Db 977 TCCATTTTT TCCCCTGCAGTCAACCCCGGGAAGACCTGGGAATGGT CAGGCAC 1029 

Qy 1958 TC G GATC T T GAC GTC CCC ATCC AGGG T C T GAT GGAGGGAAGGG GCTTGAACAG 2010 

I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I I I I 

Db 1030 TCGGATC TTGACATCCACATCGAGGGCTGAAGGAGGGAGAGAGT TTGGTATCATGAGCAG 1089 

Qy 2011 GGC C TCAGGGGAGCAGAGGGAG GGC C C T AC T GC GAGAT G AGGG AGGC C TC AGAG 2064 

I I I I I I I I I I I I I I I II I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 1090 AGC C T C AGGGT AGC AGAGGGAGGAC C C T GGC C C T C C T GGGAGAT GAGGAAGGC C TC AGGA 1149 

Qy 2065 GACCCAGCACCC T AGGAC AC C GC AC CCCTGTCT GAGAC T GAG- - GC T GC C A 2113 

I I I I I I I I I I I I II I I I I I I 1 I I I I I I I I I I I I I II I II II 

Db 1150 GAC C C AGC AC C C C AAGGC AGGGAGC CC AC C C C AC CCCTGTCT GAGAAT GAGG TGC C T C C T 1209 

Qy 2114 C T T C T GGC C T C AAGAATC AGAAC GAT GGGGAC T C AGAT T GC AT GGGGG TGGGA- - C C C AG 2171 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1210 CCTTTAGCCTCAGGAATCCAAGGGATGGCAACTCAGGTCAGCAGAGGGGTGGGTTCCAAG 1269 

Qy 2172 GCC TGC AAGGC T TAC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T GGAAT C C AGAT 2231 

III I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1270 C C C T T CC AGGATC AAGGAAAGGAAGAC GAGGG AGGAT T C AGGGGGC C T T GC AT T C C AGAT 132 9 

Qy 2232 CAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATGGCCCATATTTC 2291 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I II I I I I Ml 
Db 1330 CAGTGGAGACCTGGGCCCTGGGAGGTCCTGGGCAAGGTAGCCACCTGTAGCTCATACTTC 1389 

Qy 2292 CTGCATCTTTGAGGT GAC AGGAC AGAGC TGTGGTCT GAGAAGT GGGGC C T C AG GT C 2347 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1390 CTGCATCTTCGAGGTCACAGAGAGGAGAGGGCTATGGTCTGAGGGGTGGTACTTCAGGTC 1449 

Qy 2348 AAC AGAG GGAGGAGT T C C AGGAT C CAT AT GGC C CAAGAT GTGCC-CCCTT C ATGAGGAC T 2406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1450 C GC AGAGGGAGGAGT C C C AGGATC TAC AGGAC C C AAGGT G TGC C AC AC T T C AC GAGGAAT 1509 

Qy 2407 GGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTTTTAGTA 2466 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II II 
Db 1510 GGGGATACCTGTGGCTCAGAAAGACGGGACCCCACAGAGTCTGGCTGTCCCCTGTTCTTA 1569 

Qy 24 67 GCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCACAGGCA 252 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 
Db 1570 GCTCAGGGGGGACCAGAGGAGGGATGGCCCTATGTGCCAATTTCACTTGTTCCACAGGCA 1629 

Qy 2527 GGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCTACTCAT 2586 

I I I I I I I I I I I II I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I 
Db 1630 GGAAGTTGGGGAACCTTCAGGGAGATGAGGTTTTGGAGTAAAGGGGCAATGTTTGCTCAT 1689 
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Qy 2587 GTC AGGGAAT TGGGGGTTGAGGAAGCAC AGGC GC TGGC AGGAATAAAGATGAGTGAGAC A 2 64 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I III I I I I II I IE 
Db 1690 CTCAGGGGGTTGGGGGTTGAGGAAGGGCAGGCCCTGTCAGGAGCAAACATGAGT-ACCCA 1748 

Qy 2647 GACAAGGCTATTGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACACCTCACCC 2706 

I I I I I II III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 174 9 CAGGAGGCCATCAGAACCCTCACCCCAGAACCAAAGGGGTCAGCCCTGGGCACCCCACAC 1808 

Qy 2707 AG GATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGAC 2758 

II | I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1809 AGG GGT GAC AGGATG TGGC TC C T T C T CAT T T C TGAT T C C AGATC TC AG TGAGGTGAGGAC 1868 

Qy 2759 CTCATTC TCAGAGGGTGAC TCAGGTCAACGTAGGGACCCCCATC TGGTCTAAAGACAGAG 2818 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 

Db 1869 C T T GT T C TCAGAGGGTGAC TC AGGT C AC C AC AGGGAC CC C CATC TGGT C T AC AGAC AC AG 1928 

Qy 2819 CGGTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCC 2878 

I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1929 TGGTCCCAGGATCTGCCAAGAGTCCTGGTGAGGAATGTGAGGGAGGATTGAGGGTACCAC 1988 

Qy 2879 AGGAC C AGAAC AC TGAGGGAGAC T GC AC AGAAAT CAGC C C T GCC C C TGC T GT C AC C C C AG 2938 

I I I I I I I I I I I II I III II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1989 AGGGC C AGAAC GC AGATGATGAC C C C AC AGAAAT CAGC CCTGCTCCTG T TGT C AC C C C AG 2048 

Qy 2939 AGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAG 2998 

M I I I I I I I I I I III Mill I I I I I I I II I I I I I I I I I I I I I I II I I I I I 
Db 204 9 AGAGCATGGGCTTGGCTTTCTGCTGAGGTCCCTCTCTTATCCTGGGATCACTGGTGTCAC 2108 

Qy 2999 GGAC GGGGAGG C C T T GGT C TGAGAAGGC T GC GC T C AGG T C AGTAGAGGGAGC GT C C C AGG 3058 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2109 GGAGGGGGAGGCCTTGGTCTGAGGGGGCTGCACCCAGGTCAGTAGAGGGAGGGTCCCAGG 2168 

Qy 3059 CCC TGCCAGGAGTCAAGGTGAGGACCAAGCGGGCAC C TCACCCAGGACACATTAAT TCCA 3118 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III II II I I I I I I I I I I I I I I I I 
Db 2169 CTCTGCCAGGAGTTGAGGTGAGGACCAAGC AGGC TCCGCATCC AGGAC AC AT GGGT TCCA 2228 

Qy 3119 ATGAATTTTGATATCTCTTGCTGCCCTTC-CCCAAGGACCTAGGCACGTGTGGCCAGATG 3177 

I I I I I I I I II I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2229 ATG AAT T T C GAC ATC T T T T GC T GT C GT T C T TC GGAAGAC C T AGGC AC AGGT GGC C AGATG 2288 

Qy 3178 TTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCT 3237 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2289 TGGGGTTTCTTAGGTCCT GTTCCCTCTCAGGCATGTGAGCTCTTGATCTGAGTTTCT 2345 

Qy 3238 CAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGA 32 97 

III I I I I I I I II I I M I I I M I I I I I I I I I III I I I I I I I I I I I I I I I I I I 
Db 234 6 C AGGC CAGC AAAAGAGTGGGAT CC AGGC C C TGC C T GGAGAAAT G T GAG GGC C C T GAGT GA 2405 

Qy 3298 GAACAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTC 3357 

I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I 
Db 2406 AC AC AGT GGGG AT C ATC C AC TC C AT GAGAGT GGGGACC T C AC AGAGT C CAGC C T AC C C T C 24 65 

Qy 3358 CTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATT 3417 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2466 TTGATGGCACTGAGGGACCGGGGCTGTGCTTACAGTCTGCACCCTAAGGGCCCATGGATT 2525 

Qy 3418 CCTCTTCC TGGAGC T C C AGGAACC AGGC AG T GAGGC CTTGGTCT GAGAC AG T AT CC T C AG 3477 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I II I II I I I I I 
Db 252 6 CCTCTCCTAGGAGCTCCAGGAACAAGGCAGTGAGGCCTTGGTCTGAGACAGTGTCCTCAG 2585 


http://es/ScoreAccessWeb/GetItem. action? AppId=08819669&seqId=609517&ItemName=us.. 


Qy 3478 GTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACAC 3537 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 2586 GTTACAGAGCAGAGGATGCACAGGCTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACAC 2645 

Qy 3538 CAAGGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTA 3597 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 264 6 CAAGGGCCCCACCTGCCACAAGACACATAGGACTCCAAAGAGTCTGGCCTCACCTCCCTA 2705 

Qy 3598 CTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGA-GTACCCTCTCACT 3656 

I Ell I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I II 
Db 2706 CCATCAATCCTGCAGAATCGACCTCTGCTGGCCGGCTATACCCTGAGGTGCTCTCTCACT 2765 

Qy 3657 TCCTCCTT C AGGT T T T C AGGGGAC AGGC C AAC CC AG AGGAC AGGAT T C C C T GGAGGC C AC 3716 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2766 TCCTCCTT C AGGT T C T GAGC AGAC AGGC C AA- C C GGAGGAC AGGAT T C C C T GGAGGC C AC 2824 

Qy 3717 AGAGGAGC ACC AAGG AGAAGATC T GTAAGT AGGCC T T TGT TAGAGT C T C C AAGGT T C AGT 3776 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml Ml II II 
Db 2825 AGAGGAGC ACC AAGGAGAAGATC T GTAAGT AAGC C T T TGT TAGAGC C T C T AAGAT T T GGT 2884 

Qy 3777 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 3836 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2885 TCTCAGCTGAGGTCTCTCACATGCTCCCTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCC 2944 

Qy 3837 AGC T CC T GC C C AC AC TC C T GC C TGC TGC C C TGAC GAGAGT CAT C ATGT C TC T T GAG C AGA 3896 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2945 AGC TTTTGCCTGCACTCTTGCCTGCTGCCCTGAGCAGAGTCATC ATGT CTTCTGAGCAGA 3004 

Qy 3897 GGAGTC T GC AC T GC AAGCC T GAGGAAGC C C TT GAGGC C CAACAAGAGGC C C T GGGC C T GG 3956 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3005 AGAGTC AGC AC TGC AAGCC TGAGGAAGGCGTTGAGGCCCAAGAAGAGGCCC T GGGC C TGG 3064 

Qy 3957 TGTGTGTGCAGGCTGCCAC CTCCTCCTCCTCTCCTC 3992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3065 TGGGTGCGCAGGCTCCTACTACTGAGGAGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTC 3124 

Qy 3993 TGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTC 4052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I 
Db 3125 TGGTCCCTGGCACCCTGGAGGAAGTGCCTGCTGCTGAGTCAGCAGGTCCTCCCCAGAGTC 3184 

Qy 4053 CTCAGGGAGCCTCCGCCTTTCCCACTAC CATC AAC TTCACTCGACAGAGGCAACCCAGTG 4112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3185 CTCAGGGAGCCTCTGCCTTACCCACTAC CATC AGC TTCACT TGC TGGAGGCAACCCAATG 3244 

Qy 4113 AGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGT 4172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3245 AGGGT TC C AGC AGC CAAGAAGAGGAGGGGCC AAGC ACC TC GCC T GACG C AGAGTC C T TGT 3304 

Qy 4173 TCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATC 4232 

I I I I I I II I III III I I I I I I I III I I I I I I I I I I I I I I I I III I I I I 
Db 3305 TCCGAGAAGCACTCAGTAACAAGGTGGATGAGTTGGCTCATTTTCTGCTCCGCAAGTATC 3364 

Qy 4233 GAG C C AGGGAG C C AG T C AC AAAGGC AGAAATGC TGGAGAG T GTC AT C AAAAAT TAC AAGC 4292 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 3365 GAGC C AAGGAGC TGG T C AC AAAGGC AGAAATGC T GG AGAG AGT C AT C AAAAAT TAC AAGC 3424 

Qy 4293 ACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTG 4352 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I 
Db 3425 GCTGCTTTCCTGTGATCTTCGGCAAAGCCTCCGAGTCCCTGAAGATGATCTTTGGCATTG 3484 

Qy 4 353 ACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCT 4412 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II I 

Db 3485 ACG TGAAGGAAG T GGAC CC C ACC AGC AAC AC C TAC AC CC TTGTCACCTGCCT GGGC C T T T 3544 

Qy 4413 CC T ATGATGGC C T GC T GGG T GATAATC AGATC ATGC CCAAGAC AGGC T TC C T GAT AAT TG 4472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3545 CCTATGATGGCCTGCTGGGTAATAATCAGATCTTTCCCAAGACAGGCCTTCTGATAATCG 3604 

Qy 4473 TCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGC 4532 

I I I I I I II 11 I I I I II I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I 

Db 3605 TCCTGGGCACAATTGCAATGGAGGGCGACAGCGCCTCTGAGGAGGAAATCTGGGAGGAGC 3664 

Qy 4533 TGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGC 4592 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I II I I I I I I I I I I 

Db 3665 TGGGTGTGATGGGGGTGTATGATGGGAGGGAGCACACTGTCTATGGGGAGCCCAGGAAAC 3724 

Qy 4 593 TGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTG 4 651 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I II I I I II 
Db 3725 TGC TC AC CCAAGATT GGGT GC AGGAAAAC TAC C TGGAGTACC GGC AGGT ACC CGGC AGTA 3784 

Qy 4 652 ATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGA 4711 

I I I I II I I I I I I I I I I I I I I 1 I 1 I I I I I I I I II I I II I I I I I I I I I I I M II I I M 

Db 3785 ATCCTGCGCGCTATGAGTTCCTGTGGGGTCCAAGGGCTCTGGCTGAAACCAGCTATGTGA 3844 

Qy 4712 AAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGC 4771 

I I I I I I I III Mill III I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I 
Db 3845 AAGTCCTGGAGCATGTGGTCAGGGTCAATGCAAGAGTTCGCATTGCCTACCCATCCCTGC 3904 

Qy 4772 GT GAAGC AGC T T TGAGAGAGGAGGAAGAGGGAG T C T GAGC AT GAGT T GC AGC C AAG GC C A 4 831 

I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I III 
Db 3905 GT GAAGC AGC T T T GT T AGAGGAGGAAGAGGGAG T C T GAGC AT GAGT T GC AGC C AGGGC T G 3964 

Qy 4832 GTGGGAGGG GGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCT 4887 

I I I I I I I I I I I I I I II I I I I I I I M IN I I I I I I I I I I I I I I I 

Db 3965 TGGGGAAGGGGCAGGGCTGGGCCAGTGCATCTAACA — GCCCTGTGCAGCAGCTTCCCTT 4022 

Qy 4888 GCCTCGTGTGACATGAGGCCCATTCTTCACTC T GAAG AGAG C GGT C AGT GT TC T C A 4943 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I MINI I I I I I I I I I I I I I 
Db 4023 GCCTCGTGTAACATGAGGCCCATTCTTCACTCTGTTTGAAGAAAATAGTCAGTGTTCTTA 4082 

Qy 4944 GTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATT 5003 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 4083 GTAGTGGGTTTCTATTTTGTTGGATGACTTGGAGATTTATCTCTGTTTCCTTTTACAATT 4142 

Qy 5004 GTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTTTATGAATG 5063 

III I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I 

Db 4143 GT T GAAAT G-TTCCTTT TAATGGAT GG T TGAAT T AAC T T C AGC AT C C AAGT T T ATGAATC 4201 

Qy 5064 ACAGC AG T C AC AC AG T TC T GT GTATATAGT T T AAGGGT AAGAGT C T T GTGT T T TAT T C AG 5123 

II I I I I I I I I I I I I I I I I I I I I II I I I II M I I I I I I I I I I I II 

Db 4202 GTAGTTAACGTATATTGCTGTTAATATAGTTTAGGAGTAAGAGTCTTGTTTTTTATTCAG 4261 

Qy 5124 AT T GGGAAATC CAT T C TAT T T TGT GAAT TGGG AT AAT AAC AGC AG T GGAAT AAG TAC 5180 

I I I I II I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I 

Db 4262 AT T GGGAAAT C CGT T C TAT T T TGT GAAT T TGGGAC AT AAT AAC AGC AG TGGAGTAAGTAT 4321 

Qy 5181 T T AGAAATGT GAAAAATGAGC AGT AAAAT AGAT GAG AT AAAGAAC TAAAGAAAT T AAGAG 5240 

II I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 322 TTAGAAGTGTG AAT T C AC CG TGAAAT AGGT GAGAT AAATTAAAAG 4 3 66 

Qy 5241 ATAGTCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATATATGCAT 5300 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I III I I I I I I I I I I 
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Db 4 367 AT AC T T AAT T C C CGC C T T ATGC C T C AGT C TAT T C TG T AAAAT T T AAAAAT AT AT AT GC AT 4 426 

Qy 5301 AC C TGGAT TTCCTTGGCTTCT T TGAGAAT G TAAGAGAAAT T AAAT C TGAATAAAGAAT TC 5360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4427 ACCTGGATTTCCTTGGCTTC GTGAATGTAAGAG AAAT T AAAT CTGAAT AAAT AAT TC 4483 

Qy 5361 TTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCT 5420 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4484 TTTCTGTTAACTGGCTCATTTCTTCTCTATGCACTGAGCATCTGCTCTGTGGAAGGCCCA 4543 

Qy 5421 GGGT TAG TAGT GGAGAT GC T AAGG TAAGC C AGAC TC AT AC C C AC C C AT AGGG T C GT AGAG 5480 

II I I I I I I I I I I I I I I III I I I I I I I I I I I I II III III I I I I I I I II 
Db 4544 GGAT TAG TAGT GGAGAT AC TAGGGTAAGC CAGAC AC ACAC C TAC C GAT AGGG TAT T AAGA 4 603 

Qy 5481 TCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAGGGAAAA 5540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 604 GTCTAGGAGCGCGGTCATATAATTAAGGTGACAAGATGTCCTCTAAGATGTAGGGGAAAA 4 663 

Qy 5541 GTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGA 5 600 

II I I III I I I I MINIMI I I I I I I I I I I I I I I II I III I I I I I 

Db 4 664 GT AACGAGTGTGGGTATGGGGCTCCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGT 4719 

Qy 5601 GCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGTAATGA 5660 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I Mil I I I I I I I I I I I I 
Db 4720 G-TGGGGCCTTTTGGGCTTTGGGAAACTCCATTTTCTTCTGAGGGATCTGATTCTAATGA 4778 

Qy 5661 TCTTGGGTGGATCC 5674 

I I I I I I III 
Db 4779 AGCTTGGTGGGTCC 4792 
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PT New isolated polynucleotides and polypeptides, useful for detecting the 

PT presence of, and treating cancer, particularly kidney cancer by 

PT stimulating T-cells specific for a tumor protein, and stimulating immune 

PT response in a patient. 

XX 

PS Claim 1; SEQ ID NO 1696; 78pp; English. 
XX 

CC The invention relates to a new isolated polynucleotide (a Human kidney 

CC tumour specific cDNA) comprising any one of the 1855 sequences identified 

CC in the specification (or their complements, degenerate variants, 

CC sequences consisting of at least 20 contiguous residues them, sequences 

CC that hybridise to them under highly stringent conditions or sequences 

CC having at least 75 or 90% sequence identity to the 1855 sequences. Also 

CC included are detecting/determining the presence of cancer in a patient, 

CC stimulating an immune response in a patient; treating kidney cancer in a 

CC patient, an isolated polypeptide encoded by one of the 1855 sequences, an 

CC expression vector comprising the polynucleotide operably linked to an 

CC expression control sequence, a host cell transf ormed/transf ected with the 

CC vector, an isolated antibody (or its antigen-binding fragment) that 

CC specifically binds to the protein, a fusion protein comprising at least 

CC one the proteins, stimulating and/or expanding T-cells specific for a 

CC tumour protein, an isolated T-cell population comprising the T-cells, a 

CC composition comprising a first component (such as a carrier or 

CC immuno stimulant) and a second component (comprising one of the 

CC polynucleotides, the polypeptides, an antibody, T-cell or an antigen- 

CC presenting cell that expresses the polynucleotide) and a diagnostic kit 

CC comprising at least one of the oligonucleotides, or at least one antibody 

CC and a detection reagent comprising a reporter group. The polynucleotides, 

CC polypeptides, antibodies and antigen-presenting cells are useful for 

CC detecting the presence of, and treating cancer, particularly kidney 

CC cancer by stimulating and/or expanding T-cells specific for a tumour 

CC protein, and stimulating immune response in a patient. The present 

CC sequence is one of the Human kidney tumour specific cDNAs . Note: The 

CC sequence data for this patent did not form part of the printed 

CC specification, but was obtained in electronic format directly from USPTO 

CC at seqdata . uspto . gov/sequence . html?DocID=200301094 34 . 

XX 

SQ Sequence 4895 BP; 1134 A; 1235 C; 1433 G; 1093 T; 0 U; 0 Other; 


Query Match 

44.3%; Score 2513.6; DB 7; Length 4895; 


Best 

Local ; 

Similarity 79.9%; Pred. No. 0; 


Matches 3415; Conservative 0; Mismatches 694; Indels 165; Gaps 

32; 

Qy 

1478 

AT GG T TC T GAGGGGC GGC T TGAGAT C C AC T GAGGGG AG TGGT T T T AGG C TC T GT GAGGAG 

1537 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 


Db 

607 

ATAGTCCTGAGGGGCCAGTTGAGATCGGCTGAGGGGAGCGGGCCCAAGCTCTGTGGCGAG 

666 

Qy 

1538 

GC AAGGT GAGAT GC T GAGGGAGGAC TGAGGAGGC AC AC AC C C C AGGT AGATGGC C C C AAA 

1597 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II II II 


Db 

667 

GCAAGGTGAGAC TC TGAGGAAGGACTGAGGAGGCCC CCAC CCAAGATAGA- GGAAC CCAA 

725 

Qy 

1598 

ATGATCCAGTACCACCCCTGCTGCCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAG 

1657 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II III 1 1 1 1 1 


Db 

726 

ATAATCCAGCCCACGTCCTGCTGCCAGTCCTGGACCACCCGG GGGAAGAC T TC T C A- 

781 

Qy 

1658 

CTGGACCACCCCCCGTCCCGTCCCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATA 

1717 



III II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

782 

GGCTAGGCCATCCCAGCTCCCACTGCCACTAAAGCTACAGGGGACTCTAGAGTCA — 

836 

Qy 

1718 

GCTTATGTGACCGGGGCAGGGTTGGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGC 

1777 


1 1 1 1 II 
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Db 837 AGAGCTTGGTGTGCCCAAGGCAGGGCCAGG 8 66 

Qy 1778 AT C C GC C CGGC AT T AGGGT C AGGACC C T GGGAGGGAACTGAGGG T TCC C C AC C C AC ACC T 1837 

II Ml 1 I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 867 CTCTGCCTGGCATCGGGGTCAGGACCTTGAGAGGGAACTGAGGGCGCTACACCCCCACCC 926 

Qy 1838 GTCTCCTCATCTCCACCGCCACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACC 1897 

I II I I I I I I I I I I I I I I I I I II 

Db 927 CATCCGCATTC CAACATGCCCAGCCCCATCCCCAACTCCGTTTTGCAGAA 97 6 

Qy 1898 TCATCTTGTCAGAATCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCAC 1957 

II III I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 977 TCCATTTTT TCCCCTGCAGTCAACCCCGGGAAGACCTGGGAATGGT CAGGCAC 1029 

Qy 1958 TCGGATCTTGACGTCCCCATCCAGGGTCTGATGGAGGGAAGGG GCTTGAACAG 2010 

I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I I I I 

Db 1030 TC GGAT C T TGAC ATC C AC AT CGAGGGC T GAAGGAGGGAGAGAGT T T GG TAT C ATGAGC AG 1089 

Qy 2011 GGC C T C AGGGG AGC AGAGGGAG GGC C C T AC T GC GAGATGAGGGAGGC C T C AGAG 2064 

I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 1090 AGC C TC AGGGT AGC AGAGGGAGGAC C C T GGC C C T CC TGGGAGAT GAGGAAGGC C TC AGGA 1149 

Qy 2065 GACCCAGCACCC T AGGAC AC C GC AC CC C TGT C T GAGAC TGAG - - GC TGC C A 2113 

I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 1150 GAC C CAGC AC C C C AAGGC AGGGAGC C C AC C C C AC CC C TGT C T GAGAAT GAGG TGC C T C C T 1209 

Qy 2114 CTTCTGGCCTCAAGAATCAGAACGATGGGGACTCAGATTGCATGGGGGTGGGA — CCCAG 2171 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1210 CCTTTAGCCTCAGGAATCCAAGGGATGGCAACTCAGGTCAGCAGAGGGGTGGGTTCCAAG 1269 

Qy 2172 GCC TGCAAGGC TTACGCGGAGGAAGAGGAGGGAGGACTCAGGGGACCT TGGAATCCAGAT 2231 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1270 C C C T TC C AGGAT C AAGGAAAGGAAGAC GAGGGAGGAT TC AGGGGGC C T T GC AT T C C AGAT 1329 

Qy 2232 CAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATGGCCCATATTTC 2291 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I III 
Db 1330 C AG T GGAGAC C T GGGC C C T GGGAGGT C C TGGGC AAGG T AG CC AC C T GT AGC T CAT AC T TC 1389 

Qy 2292 CTGCATCTTTGAGGT GAC AGGAC AGAGC TGTGGTC T GAGAAGTGGGGC C TCAGGTC 2347 

I 1 I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1390 C TGC ATC T TCGAGGT C ACAGAGAGGAGAGGGC TATGGTC T GAGGGGTGGTAC T TCAGGTC 144 9 

Qy 2348 AAC AGAG GGAGGAGT T C C AGGAT C C AT ATGGC C C AAGATG TGC C - C C C T T CAT G AGGAC T 2406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1450 C GC AGAGGGAGGAGT C C C AGGAT C T AC AGGAC C C AAGG T G TGC C AC AC T T C AC GAGGAAT 1509 

Qy 2407 GGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTTTTAGTA 2466 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II II 
Db 1510 GGG GAT AC C T G T GGC TC AGAAAGAC GGGAC C C CAC AGAGT CTGGCTGTCCCCTGTTCT T A 1569 

Qy 24 67 GCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCACAGGCA 252 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I MINIMI 
Db 1570 GCTCAGGGGGGACCAGAGGAGGGATGGCCCTATGTGCCAATTTCACTTGTTCCACAGGCA 1629 

Qy 2527 GGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCTACTCAT 258 6 

I I I I I I I I I M II I I I I I M I I II III I I I I I I I I I I I I I I II I I Mill 
Db 1630 GGAAGTTGGGGAACCTTCAGGGAGATGAGGTTTTGGAGTAAAGGGGCAATGTTTGCTCAT 1689 

Qy 2587 GTC AGGGAAT T GGGGGT T G AGGAAGC AC AGGCGC T GGC AGGAAT AAAGAT GAGT GAGAC A 2646 

I I I I II I II I I I I I I I I I I I I I I I I I I III I I I I I II I I I I I I I I II 
Db 1690 CTCAGGGGGTTGGGGGTTGAGGAAGGGCAGGCCCTGTCAGGAGCAAACATGAGT-ACCCA 174 8 
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Qy 2647 GAC AAGGC TAT T GGAATC C AC ACC C C AGAAC C AAAGGGGTC AGC C C TGGAC AC C TC AC C C 2706 

I I I I I II III II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I III I 

Db 1749 C AGGAGGC C AT C AGAAC C C T CACC C C AGAAC C AAAGGGGTC AGC C C TGGGC AC C CC AC AC 1808 

Qy 2707 AG GATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGAC 2758 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1809 AGGGG T GAC AGGAT G TGGC T C C TT C TC AT T TC T GAT T C C AGATC T C AG TGAGGTGAGGAC 18 68 

Qy 2759 C T C AT T C T C AGAGGG TGAC T CAGG TC AAC GT AGGGAC C C C CATC T GGT C T AAAGAC AGAG 2818 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 

Db 1869 C T T GT T C TC AGAGGG TGAC T C AGG TC AC C AC AGGGAC C C C CATC T GGT C TAC AGAC AC AG 1928 

Qy 2819 CGGTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCC 2878 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 192 9 TGGTCCCAGGATCTGCCAAGAGTCCTGGTGAGGAATGTGAGGGAGGATTGAGGGTACCAC 1988 

Qy 2879 AGGAC C AGAAC AC T GAGGGAGACT GC AC AGAAAT C AGC CCTGCCCCTGCT G TC AC C C C AG 2938 

III I I I I I I I I II I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 198 9 AGGGC C AGAAC GC AGATGATGACC C CAC AGAAAT C AGC C C T GC T C C TG TTGT C AC C C C AG 2048 

Qy 2939 AGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAG 2998 

I I I I I I I I I I I I III I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I 

Db 2049 AGAGCATGGGCTTGGCTTTCTGCTGAGGTCCCTCTCTTATCCTGGGATCACTGGTGTCAC 2108 

Qy 2999 GGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGG 3058 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 2109 GGAGGGGGAGGCCTTGGTCTGAGGGGGCTGCACCCAGGTCAGTAGAGGGAGGGTCCCAGG 2168 

Qy 3059 CCCTGCCAGGAGTCAAGGTGAGGACCAAGCGGGCACCTCACCCAGGACACATTAATTCCA 3118 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III II II I I I I I I I I I I I I I I I I 

Db 2169 CTCTGCCAGGAGTTGAGGTGAGGACCAAGCAGGCTCCGCATCCAGGACACATGGGTTCCA 2228 

Qy 3119 ATGAATTTTGATATCTCTTGCTGCCCTTC-CCCAAGGACCTAGGCACGTGTGGCCAGATG 3177 

I I I I I I I I II I I I I I I I I I I I III I I I II I I I I I I I I I I I I I I I I I I I 

Db 2229 ATGAAT T T C GAC AT C T T T T GC TGTCGTTCTTC GGAAGAC C TAGGC AC AGGT GGC C AGAT G 2288 

Qy 3178 TTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCT 3237 

I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2289 TGGGGTTTCTTAGGTCCT GTTCCCTCTCAGGCATGTGAGCTCTTGATCTGAGTTTCT 2345 

Qy 3238 CAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGA 32 97 

III I I I I I I II I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 2346 C AGGC C AGC AAAAGAGTGGGAT CC AGGC C C T GC C TGGAGAAAT G T GAG GGC C C T GAGT GA 2405 

Qy 3298 GAACAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTC 3357 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2406 ACACAGTGGGGATCATCCACTCCATGAGAGTGGGGACCTCACAGAGTCCAGCCTACCCTC 24 65 

Qy 3358 CTGGT AGC AC TGAGAAGCC AGGGC TGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATT 3417 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2466 TTGATGGCACTGAGGGACCGGGGCTGTGCTTACAGTCTGCACCCTAAGGGCCCATGGATT 2525 

Qy 3418 CCTCTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAG 3477 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 252 6 C C TC T C C TAGGAGC T C C AG GAAC AAGGC AGTG AGGC CTTGGTCT GAGAC AGT GT CC T C AG 2585 

Qy 3478 GTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACAC 3537 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 258 6 GTTACAGAGCAGAGGATGCACAGGCTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACAC 2 645 
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Qy 3538 C AAGGGC C CC ACC TGC C AC AGGAC AC AT AGGAC T C C AC AGAGTC TGGC C TC ACC T C C C TA 3597 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I 
Db 264 6 C AAGGGC C C C ACC TGC C AC AAGAC AC AT AGGAC T C C AAAGAGTC TGGC C TC ACC T C C C TA 2705 

Qy 3598 CTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGA-GTACCCTCTCACT 3656 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2706 C CAT C AATC C T GC AGAATC GACC T C TGC TGGC C GGC TAT AC C C T GAGG T GC T C T C T C AC T 27 65 

Qy 3657 TCCTCCTT C AG GT T T TC AGGGGAC AGGC C AAC C C AG AGGACAGGAT T C C C T GGAGGC C AC 3716 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 66 TCCTCCTT C AGGT TC TGAGC AGAC AGGC CAA- C C GGAGGAC AGGAT T C C C T GGAGGC C AC 2824 

Qy 3717 AGAGGAGC AC C AAGGAGAAGATC T GTAAGTAGGC C T T T GT T AGAGT C T C C AAGGT T C AGT 3776 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III III II II 
Db 2825 AGAGGAGC ACC AAGGAGAAGATC TGTAAGTAAGCC T TTGT TAGAGCC TC TAAGAT T TGGT 2884 

Qy 3777 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 3836 

I I I I I I I I I I I I MINIM I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2885 TCTCAGCTGAGGTCTCTCACATGCTCCCTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCC 2 944 

Qy 3837 AGC T CC T GC C C AC AC TCCTGCCTGCT GC CC T GAC GAGAGT C ATC ATGT C T C T TGAGC AGA 3896 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I 

Db 2 945 AGC T TT T GC C T GC AC TCTTGCCTGCT GC CC TGAGC AGAGT CATC ATGT C T TC TGAGC AGA 3004 

Qy 3897 GGAGTC T GC AC TGCAAGCC TGAGGAAGC CC T T GAGGCC CAACAAGAGGCCC T GGGC CTGG 3956 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I 
Db 3005 AGAGTC AGC AC TGC AAGC C T GAGGAAGGCGT T GAGGC C C AAGAAGAGGC C C T GGGC C T GG 3064 

Qy 3957 TGTGTGTGCAGGCTGCCAC CTCCTCCTCCTCTCCTC 3992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3065 TGGGTGCGCAGGCTCCTACTACTGAGGAGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTC 3124 

Qy 3993 TGGTCCT GGGC ACC CTGGAGGAGGTGCCCACTGCTGGGTC AAC AGATCCTCCCC AGAGTC 4052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I 
Db 3125 TGGTCCCTGGCACCCTGGAGGAAGTGCCTGCTGCTGAGTCAGCAGGTCCTCCCCAGAGTC 3184 

Qy 4 053 C T C AGGG AGC CTCCGCCTTT C CC AC T AC CAT C AAC T T C AC T C GAC AGAGGC AAC C C AGT G 4112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3185 CTCAGGGAGCCTCTGCCTTACCCACTACCATCAGCTTCACTTGCTGGAGGCAACCCAATG 3244 

Qy 4113 AGGGTTCC AGC AGCCGTGAAGAGGAGGGGCCAAGC ACC TC TTGT ATCCTGGAGTCC TTGT 4172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3245 AGGG T TC C AGC AGC C AAGAAGAGGAGGG GC C AAGC AC CTCGCCT GAC GC AGAGTC C TTGT 3304 

Qy 4173 TCCGAGCAGTAATCACTAAGAAGGTGGCTGATT TGGT TGGT TTTC TGC TCCTCAAAT ATC 4232 

I I I I I I II I III III I I I I I I I III I I I I I I II I I I I I I I I III I I I I 

Db 3305 T C C GAGAAGC AC T C AGTAAC AAGG TGGATGAG T TGG C TC AT T T T C TGC T CC GCAAG T ATC 3364 

Qy 4233 GAG C C AGGGAGC C AG TC AC AAAGGC AGAAAT GC T GGAGAGTG TC AT C AAAAAT TAC AAGC 4292 

MINI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3365 GAGC C AAGGAGC T GG T C AC AAAGGC AGAAAT GC TGGAGAGAGTC AT C AAAAAT TAC AAGC 3424 

Qy 4293 ACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTG 4352 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II II II I I I I I II I I II I 
Db 3425 GCTGCTTTCCTGTGATCTTCGGCAAAGCCTCCGAGTCCCTGAAGATGATCTTTGGCATTG 3484 

Qy 4 353 ACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCT 4 412 

I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I I I I I II I I I I I II II I 
Db 3485 ACGTGAAGGAAGTGGACCCCACCAGCAACACCTACACCCTTGTCACCTGCCTGGGCCTTT 3544 

Qy 4413 CCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTG 44 72 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 II I I 

Db 3545 C C TAT GAT GGC C T GC TGGG T AATAATC AGAT C T T TC CC AAGAC AGGC C T T C T GAT AATC G 3604 

Qy 44 73 TCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGC 4 532 

I I I I I I II I I I I I I II I I I 1 I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3605 T C C TGGGC AC AAT TGC AAT GGAGGGC GAC AGCGC C T C TGAGGAGGAAAT C T GGGAGGAGC 3664 

Qy 4533 TGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGC C TAT GGGGAGCC CAGGAAGC 4592 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3665 TGGGTGTGATGGGGGTGTATGATGGGAGGGAGCACACTGTCTATGGGGAGCCCAGGAAAC 3724 

Qy 4593 T GC TC AC C C AAGAT T TGGT GC AGGAAAAGTAC C T GG AG T A- C GGC AGGTGC C GGAC AG T G 4 651 

I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I II I 
Db 3725 TGCTCACCCAAGATTGGGTGCAGGAAAACTACCTGGAGTACCGGCAGGTACCCGGCAGTA 3784 

Qy 4 652 ATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGA 4711 

I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3785 ATCCTGCGCGCTATGAGTTCCTGTGGGGTCCAAGGGCTCTGGCTGAAACCAGCTATGTGA 384 4 

Qy 4712 AAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGC 4771 

I I I I I I I III I I I I I III I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I 
Db 3845 AAGTCCTGGAGCATGTGGTCAGGGTCAATGCAAGAGTTCGCATTGCCTACCCATCCCTGC 3904 

Qy 4772 GTGAAGC AGC T TTGAGAGAGGAGGAAGAGGGAGTC T GAGC ATGAGT TGCAGC CAAGGCC A 4831 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I III 
Db 3905 GT GAAGC AGC T T T GT T AGAGGAGGAAGAGGGAGT C T GAGC AT GAGT T GC AGC C AGGGC T G 3964 

Qy 4832 GTGGGAGGG GGAC T GGGC C AG T GC AC C T T C C AGGGC C G C GT C C AGC AGC T T C C C C T 4887 

I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I 

Db 3965 TGGGGAAGGGGCAGGGCTGGGCCAGTGCATCTAACA— GCCCTGTGCAGCAGCTTCCCTT 4022 

Qy 4888 GCCTCGTGTGACATGAGGCCCATTCTTCACTC T GAAGAGAGC GGT C AGT GT T C TC A 4943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4023 GCCTCGTGTAACATGAGGCCCATTCTTCACTCTGTTTGAAGAAAATAGTCAGTGTTCTTA 4082 

Qy 4944 GTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATT 5003 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I 

Db 4083 GTAGTGGGTTTCTATTTTGTTGGATGACTTGGAGATTTATCTCTGTTTCCTTTTACAATT 4142 

Qy 5004 GTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTTTATGAATG 5063 

III Mill I I I II II I II I II I I I II I I II I I II I I I M I II II I I I I I I I I I 
Db 4143 GTTGAAATG-TTCCTTTTAATGGATGGTTGAATTAACTTCAGCATCCAAGTTTATGAATC 4201 

Qy 5064 AC AGC AG T C AC AC AG TTC T GT G TAT AT AGT T T AAGGGT AAGAGT C TTGTGTTT TAT T C AG 5123 

II I I I I I I II I I II I II I I I I I I II I II I I I I I I I I I M I I I I I 

Db 4202 GT AGT T AAC GT AT AT TGC T GT T AATATAGT T TAGGAGT AAGAGT CTTGTTTTT TAT T C AG 4261 

Qy 5124 ATTGGGAAATCCATTCTATTTTGTGAATTGGG ATAATAACAGCAGTGGAATAAGTAC 5180 

II I I M I I I I II I M I M I I II I I II I I M I I I II I I I M I I I I I I I I I I I I I 

Db 42 62 AT TGGGAAAT C C GT T C TAT T T T GT GAAT T TGG GAC AT AAT AAC AGC AG TGGAGTAAG TAT 4321 

Qy 5181 T TAGAAAT GT GAAAAATGAGC AGT AAAAT AGAT GAG AT AAAGAAC TAAAGAAAT T AAGAG 5240 

I II II I I M I III I I I I II II I M I I I I I I I M M II 

Db 4322 TTAGAAGTGTG AAT T C AC C G T GAAATAG GT GAGAT AAATTAAAAG 4366 

Qy 5241 AT AGT C AAT T C T TGC C T TAT AC C T C AG T CTAT TC T G TAAAAT T T T T AAAGAT AT AT GC AT 5300 

III I I I I I I I I I I II I II I II II I I I I I II I I I I I I I I I III II I I II I II I 

Db 4367 AT AC T T AAT TC C CGC C T TATGC C T C AGT C TAT T C T G TAAAAT T T AAAAAT AT AT AT GC AT 4426 

Qy 5301 AC C T GG AT TTCCTTGGCTTCTTT GAG AAT GT AAGAG AAAT T AAAT C T G AAT AAAGAAT T C 5360 

I I II I II I II I I I I I I I II I I I II II I I II I I II I I I I I I I I II I I II II I I I I I 
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Db 4427 ACCTGGATTTCCTTGGCTTC GTGAATGTAAGAGAAAT TAAATC TGAATAAATAATTC 4483 

Qy 5361 TTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCT 5420 

II I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4484 TTTCTGTTAACTGGCTCATTTCTTCTCTATGCACTGAGCATCTGCTCTGTGGAAGGCCCA 4543 

Qy 5421 GGG TT AG TAGT GGAGAT GC TAAGG TAAGC C AG AC T CAT AC C C AC C C AT AGGG TC GT AGAG 5480 

II I I I I I I I I I I I I I I III I I I I I I I I I I I I II III III I I I I I I I II 
Db 4544 GGATT AG TAGT GGAGAT AC TAGGG TAAGC C AG AC AC AC AC C TAC C GAT AGGG TAT T AAGA 4603 

Qy 5481 TCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAGGGAAAA 5540 

I MINI I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 4 604 GTCTAGGAGCGCGGTCATATAATTAAGGTGACAAGATGTCCTCTAAGATGTAGGGGAAAA 4663 

Qy 5541 GTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGA 5600 

II E I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 

Db 4664 GT AACGAGTGTGGGTATGGGGCTCCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGT 4719 

Qy 5601 GC T GGGGC AT T T TGGGC T T T GGGAAAC T GC AG TTCCTTCT GGGGGAGC T GAT TGT AAT GA 5660 

I I I I I I I I I M I I I I I I I I I M I I II II II I I II I I MM I I I II I I I II I I 

Db 4720 G-TGGGGCCTTTTGGGCTTTGGGAAACTCCATTTTCTTCTGAGGGATCTGATTCTAATGA 4778 

Qy 5661 TCTTGGGTGGATCC 5674 

I I I II I Ml 
Db 4779 AGCTTGGTGGGTCC 4792 
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XX 

PS Claim 13; SEQ ID NO 1696; 252pp; English. 
XX 

CC The invention describes a new isolated polynucleotide (I) comprising: any 

CC one of the 1855 sequences identified in the specification; complements or 

CC degenerate variants of (a); sequences consisting of at least 20 

CC contiguous residues of (a); sequences that hybridize to (a) under highly 

CC stringent conditions; or sequences having at least 7 5 or 90% sequence 

CC identity to (a). Also described are: detecting (Ml) or determining the 

CC presence of cancer in a patient; stimulating (M2) an immune response in a 

CC patient; treating (M3) kidney cancer in a patient; an isolated 

CC polypeptide (II) encoded by (I) and comprising, or having at least 70 or 

CC 90% sequence identity to, any one of the 8 sequences identified in the 

CC specification; an expression vector (III) comprising (I) operably linked 

CC to an expression control sequence; a host cell (IV) transformed or 

CC transfected with (III); an isolated antibody (V) or its antigen-binding 

CC fragment that specifically binds to (II); a fusion protein (VI) 

CC comprising at least one (II); an oligonucleotide (VII) that hybridizes to 

CC the nucleotide sequences cited above under highly stringent conditions; 

CC stimulating (M4) and/or expanding T-cells specific for a tumor protein; 

CC an isolated T-cell population (VIII) comprising the T-cells in (M4); a 

CC composition (IX) comprising a first component such as a carrier or 

CC immunostimulant and a second component comprising (I), the polypeptide 

CC encoded by (I), an antibody or its antigen-binding fragment that 

CC specifically binds to (II), (VI), or an antigen-presenting cell that 

CC expresses the polynucleotide; and a diagnostic kit (X) comprising at 

CC least one of the oligonucleotide, or at least one antibody and a 

CC detection reagent comprising a reporter group. The polynucleotides, 

CC polypeptides, antibodies and antigen-presenting cells are useful for 

CC detecting the presence of, and treating cancer, particularly kidney 

CC cancer by stimulating and/or expanding T-cells specific for a tumor 

CC protein, and stimulating immune response in a patient. This sequence 

CC represents a kidney tumour cDNA, expression of which is increased in 

CC kidney tumors. 

XX 

SQ Sequence 4895 BP; 1134 A; 1235 C; 1433 G; 1093 T; 0 U; 0 Other; 

Query Match 44.3%; Score 2513.6; DB 7; Length 4895; 

Best Local Similarity 79.9%; Pred. No. 0; 

Matches 3415; Conservative 0; Mismatches 694; Indels 165; Gaps 32; 

Qy 1478 ATGGTTCTGAGGGGCGGCTTGAGATCCACTGAGGGGAGTGGTTTTAGGCTCTGTGAGGAG 1537 

. II II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I III 

Db 607 ATAGTCCTGAGGGGCCAGTTGAGATCGGCTGAGGGGAGCGGGCCCAAGCTCTGTGGCGAG 666 

Qy 1538 GC AAGGT GAGAT GC T GAGG GAGGAC T GAGGAGGC AC AC AC C C C AGGTAGAT GGC C C C AAA 1597 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II II II 
Db 667 GCAAGGT GAGAC TC TGAGGAAGGACTGAGGAGGCCC CCAC CCAAGATAGA- GGAACCCAA 725 

Qy 1598 ATG AT CC AGT AC C AC C C C T GC TGC C AGC C C TGGAC C AC C C GGC C AGGACAGAT GT C T C AG 1657 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II III I I I I I 
Db 72 6 ATAATCCAGCCCACGTCCTGCTGCCAGTCCTGGACCACCCGG GGGAAGACTTCTCA- 781 

Qy 1658 CTGGACCACCCCCCGTCCCGTCCCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATA 1717 

III II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 782 GGC T AGGC C AT CC C AGC T C C C ACTGC C AC T AAAGC T AC AGGGGAC T C TAG AGT C A — 836 

Qy 1718 GCTTATGTGACCGGGGCAGGGTTGGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGC 1777 

MM II I I II I II I 

Db 837 AGAGCTTGGTGTGCCCAAGGCAGGGCCAGG 866 
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Qy 1778 ATCCGCCCGGCATTAGGGTCAGGACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCT 1837 

II III I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 867 C TC T GC C TGGC AT C GGGGT C AGGAC C T T GAGAGGGAAC TGAGGG CGC T AC AC C C C C AC C C 926 

Qy 1838 GTCTCCTCATCTCCACCGCCACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACC 1897 

I II I I I I I I I I I I I I I I I I I II 

Db 927 CATCCGCATTC CAACATGCCCAGCCCCATCCCCAACTCCGTTTTGCAGAA 976 

Qy 1898 TCATCTTGTCAGAATCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCAC 1957 

II III II I E I I I I I I I I I I II I I I I I I I I I I I I I I I I II I 

Db 977 TCCATTTTT TCCCCTGCAGTCAACCCCGGGAAGACCTGGGAATGGT CAGGCAC 1029 

Qy 1958 TCGGATCTTGACGTCCCCATCCAGGGTCTGATGGAGGGAAGGG GCTTGAACAG 2010 

I I I I I I II I I I I I I I I I I I I I I I II II III I 111*111 

Db 1030 TCGGATC T TGACATC CACATCGAGGGC T GAAGGAGGGAGAGAGT T TGG TATC ATGAGCAG 1089 

Qy 2011 GGC C TC AGGGGAGC AGAGGGAG GGC C C T AC T GC G AGATGAGGGAGGC C T C AGAG 2064 

I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 1090 AGCCTCAGGGTAGCAGAGGGAGGACCCTGGCCCTCCTGGGAGATGAGGAAGGCCTCAGGA 1149 

Qy 2065 GACCCAGCACCC T AGGAC AC C GC AC CCCTGTCT GAGAC T GAG — GCTGCCA 2113 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 1150 GAC C C AGC AC C C C AAGGC AGGGAGC C C AC C C C AC C C C TGT C TGAGAAT GAGG T GC C TC C T 1209 

Qy 2114 C T T C TGG C C T C AAGAATCAGAAC GAT GGGGAC T C AG AT T GC ATGGGGG TGGG A — CCCAG 2171 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1210 CCTTTAGCCTCAGGAATCCAAGGGATGGCAACTCAGGTCAGCAGAGGGGTGGGTTCCAAG 1269 

Qy 2172 GCC TGC AAGGC T TAC GCGGAGGAAGAGGAGGGAGGAC TCAGGGGACC T TGGAATCC AGAT 2231 

III I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1270 CCC TTCCAGGATCAAGGAAAGGAAGACGAGGGAGGATTCAGGGGGCCT TGCATTCC AGAT 1329 

Qy 2232 CAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATGGCCCATATTTC 22 91 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I II I I II III 
Db 1330 CAGTGGAGACCTGGGCCCTGGGAGGTCCTGGGCAAGGTAGCCACCTGTAGCTCATACTTC 1389 

Qy 2292 CTGCATCTTTGAGGT GAC AGGAC AGAGC TGTGGTC T GAGAAGTGGGGC C TCAGGTC 2347 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 

Db 1390 CTGCATCTTCGAGGTCACAGAGAGGAGAGGGCTATGGTCTGAGGGGTGGTACT TCAGGTC 1449 

Qy 2348 AAC AGAGGGAGGAGT TCCAGGATC C ATATGGC CCAAGATGTGCC - CCC TTC ATGAGGAC T 2406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1450 C GC AGAG GGAGGAGT C CCAGGATC TAC AGGAC C CAAGGTG T GC C AC AC T TC AC GAG GAAT 1509 

Qy 2407 GGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTTTTAGTA 2466 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II II 
Db 1510 GGGGATACCTGTGGCTCAGAAAGACGGGACCCCACAGAGTCTGGCTGTCCCCTGTTCTTA 1569 

Qy 24 67 GCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCACAGGCA 252 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I II I 
Db 1570 GCTCAGG GGGGAC CAGAGGAGGGAT GGC CCTATGTGCCAAT TTC AC TTGTTCCACAGGCA 1629 

Qy 2527 GGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCTACTCAT 2586 

I I I I I I I I I I I II I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I 
Db 1630 GGAAGTTGGGGAACCTTCAGGGAGATGAGGTTTTGGAGTAAAGGGGCAATGTTTGCTCAT 1689 

Qy 2587 GTC AGGGAAT T GGGGGTTGAGGAAGCAC AGGC GC TGGC AGGAAT AAAGATGAGTGAGACA 264 6 

I I I I I I I I I I I I I I I I I I I II I I I I I I III I I I I I III I I I I I I I II 
Db 1690 CTCAGGGGGTTGGGGGTTGAGGAAGGGCAGGCCCTGTCAGGAGCAAACATGAGT-ACCCA 1748 

Qy 2647 GAC AAGGC TAT TGGAATC C AC ACC C C AG AAC C AAAGGGGT C AGC C C T GGAC AC C TC ACC C 2706 
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I I I I I II III II I I I I I I I I II I I I M I I I I I I I I I I I I I I MM III ! 

Db 1749 C AGGAGGCC AT C AGAACC C T C AC C C C AGAAC C AAAGGGGT C AGC C C TGGGC ACCC C AC AC 1808 

Qy 2707 AG GATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGAC 2758 

II I I I I I I I I I I II I I I M I M I M I M I I M I II I 

Db 1809 AGGGGTGAC AGGAT GT GGC T C CT T C TC ATT T C TGAT T C C AGAT C T C AG TGAGGT GAGGAC 1868 

Qy 2759 CTCATTC TCAGAGGGTGAC TCAGGTCAACGTAGGGACCCCCATC TGGTCTAAAGACAGAG 2818 

II I I I I I I I II I I I II I M II M I I I I I I I I I I I II I I I I M I I I I II I I I II 

Db 1869 CTTGTTC TCAGAGGGTGAC TCAGGTCAC CACAGGGACCCCCATC TGGTCTACAGACACAG 1928 

Qy 2819 CGGTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCC 2878 

M II I I I M II II I I I I I II I I I I I I I I II I I I II I I I I I I I I I I I I I M I 
Db 1929 TGGT C C C AGGAT C T GC C AAGAGTC C TGG TGAGGAAT GTGAGGGAGGAT TGAGGGTAC C AC 1988 

Qy 2879 AGGAC C AGAAC AC TGAGGGAGAC T GC AC AGAAATC AGCCC TGCCCCTGCTGTCACCC C AG 2938 

Ml I I I M I I I II I Ml M I I I I I I I M I I I II I I I II I I I I I II II I I I 

Db 1989 AGGGCCAGAACGCAGATGATGACCCCACAGAAATCAGCCCTGCTCCTGTTGTCACCCCAG 2048 

Qy 2939 AGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAG 2998 

I I I I I I I I I I M III I I I I I I I I I I M II II I I I I I I I I II I I II Mill 
Db 2049 AGAGCATGGGCTTGGCTTTCTGCTGAGGTCCCTCTCTTATCCTGGGATCACTGGTGTCAC 2108 

Qy 2999 GGAC GGGGAGGCC T TGGTC TGAGAAGGC TGCGC TCAGGTC AGTAGAGGGAGC GTCC CAGG 3058 

III II II I I I II I I I I I M I I I II I I II I I II I I I IE II II I I I I 1 I I M I I I I 

Db 2109 GGAGGGGGAGGCCTTGGTCTGAGGGGGCTGCACCCAGGTCAGTAGAGGGAGGGTCCCAGG 2168 

Qy 3059 C C C T GC C AGGAGT CAAGGT GAGGAC C AAGCGG GC AC C T C AC C C AGGAC AC AT T AAT T C C A 3118 

I I I I I I II I I I I I I I II M II I I II I I III II II I II II I II II I II II I 
Db 2169 CTCTGCC AGGAGT TGAGGTGAGGACCAAGCAGGC TCCGCATCC AGGAC AC AT GGGTTCC A 2228 

Qy 3119 ATGAATTTTGATATCTCTTGCTGCCCTTC-CCCAAGGACCTAGGCACGTGTGGCCAGATG 3177 

I I II II I I I I II II II II I I I I I I I I II I II II II I I I I I I II I I I II 
Db 2229 ATGAATTTCGACATCTTTTGCTGTCGTTCTTCGGAAGACCTAGGCACAGGTGGCCAGATG 2288 

Qy 3178 TTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCT 3237 

I I II I I II I I I I I I I I I I I I I I I I II II I I I I II I I I I I 

Db 2289 TGGGGTTTCTTAGGTCCT GTTCCCTCTCAGGCATGTGAGCTCTTGATCTGAGTTTCT 2345 

Qy 3238 CAGACCAGCAAAAGGGCAGGATCC AGGC CC TGCCAGGAAAAATATAAGGGC C CTGC GTGA 3297 

III I I I I I I I I II I I I I I II II I II I II I I III I II I I II II I I I II I I I I 
Db 2346 C AGGC C AGC AAAAGAGT GGGAT C C AGGC CC T GC C T GGAGAAATG T GAGGGC C C T GAGT GA 2405 

Qy 3298 GAAC AGAGGGGGT C AT CC AC T GC AT GAGAGTGGGGAT GT C AC AGAGT C C AGC C C AC C C T C 3357 

I II I I II I I I I II II II I I I II M I II II II II I I II I II II II II I I II II 
Db 2406 ACACAGTGGGGATCATCCACTCCATGAGAGTGGGGACCTCACAGAGTCCAGCCTACCCTC 24 65 

Qy 3358 CTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATT 3417 

II I II II II II II I II I II I 11 II I II II II I I II I I I I II I I I I I I I I 

Db 24 66 TTGATGGCACTGAGGGACCGGGGCTGTGCTTACAGTCTGCACCCTAAGGGCCCATGGATT 2 525 

Qy 3418 CCTCTTCC TGGAGC T C C AGGAAC C AGGC AGT GAGGC CTTGGTCT GAGAC AGT AT C C TC AG 3477 

I I I I I I I I I II II I II I I I I II I I I II I I I I I II I I I I I I I I I I I I I I I I I I I II 

Db 2526 CCTCTCC TAGGAGC TCC AGGAAC AAGGCAGTGAGGCC TTGGTCTGAGACAGTGTCC TC AG 2585 

Qy 3478 GT C AC AG AGC AGAGGATGC AC AGGG TGT GC C AGC AG T GAAT GT T T GC C C TGAAT GC AC AC 3537 

II I I I II I I I II II II I I I II I I I II II I I II II I I I II I I II I I II I I I I I M I I II 

Db 2586 GT T AC AGAGC AGAGGAT GC AC AGGC TGT GC C AGCAG T GAAT GT T TGC C C TGAATGC AC AC 2645 

Qy 3538 C AAGGGC CC C ACC T GC C AC AGGAC AC AT AGGACT C C AC AG AG TC T GGC C TC AC C TC CC T A 3597 

I I I I I II II II II I I II II I I I I I I II II I I II I II I I II I I I I I II I I I I II I I II I 
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Db 2 646 CAAGGGCCCCACCTGCCACAAGACACATAGGACTCCAAAGAGTCTGGCCTCACCTCCCTA 2705 

Qy 3598 CTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGA-GTACCCTCTCACT 3656 

I III I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I 1 I II I I I I I I I I I 
Db 2706 CCATCAATCCTGCAGAATCGACCTCTGCTGGCCGGCTATACCCTGAGGTGCTCTCTCACT 27 65 

Qy 3657 TCCTCCTTCAGGTTTTCAGGGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCAC 3716 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2766 TCCTCCTTCAGGTTCTGAGCAGACAGGCCAA-CCGGAGGACAGGATTCCCTGGAGGCCAC 2824 

Qy 3717 AGAGGAGC AC C AAGGAGAAGATCT GTAAGT AGGC C T T T G T TAGAGTC T CC AAGGTT C AGT 3776 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III III II II 
Db 2825 AGAGGAGCACC AAGGAGAAGATCT GTAAGTAAGCCT TTGT TAGAGCC TCTAAGATT TGGT 2884 

Qy 3777 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 38 36 

I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I II I I I I I I I I I I I 
Db 2885 TCTCAGCTGAGGTCTCTCACATGCTCCCTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCC 2944 

Qy 3837 AGC T C C T GC C C AC AC TCCTGCCTGCTGCCCT GAC GAGAG T CAT CAT GT C TC T T GAGC AGA 3896 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2945 AGCTTTTGCCTGCACTCTTGCCTGCTGCCCTGAGCAGAGTCATCATGTCTTCTGAGCAGA 3004 

Qy 3897 GGAGT C T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGGCCC T GGGC C TGG 3956 

I I I II I I I II I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I II I I I 
Db 3005 AGAGT C AGC AC T GC AAGC C T GAGGAAGGC GT T GAGGC C CAAGAAGAGGCC C T GGGC C T GG 3064 

Qy 3957 TGTGTGTGCAGGCTGCCAC CTCCTCCTCCTCTCCTC 3992 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 3065 TGGGTGCGCAGGCTCCTACTACTGAGGAGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTC 3124 

Qy 3993 TGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTC 4052 

I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I 
Db 3125 TGGTCCCTGGCACCCTGGAGGAAGTGCCTGCTGCTGAGTCAGCAGGTCCTCCCCAGAGTC 3184 

Qy 4053 C T C AGGGAGC CTCCGCCTTTCC C AC T AC C AT C AAC T T C AC T C GACAGAGGC AAC CC AGT G 4112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3185 CTCAGGGAGCCTCTGCCTTACCCACTACCATCAGCTTCACTTGCTGGAGGCAACCCAATG 3244 

Qy 4113 AGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGT 4172 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3245 AGGG T T C C AGC AGCC AAGAAGAGGAGGGGC C AAGC AC C T C GC C T GAC G C AGAGT CC TTGT 3304 

Qy 4173 TC C GAGC AG TAAT C AC TAAGAAGG T GGC TGAT T T GG T T GG T T T T C TGC T C C T C AAATATC 4232 

I I I I I I II I III III I I I I I I I III I I I I I I I I I I I I I I I I III I I I I 
Db 3305 TCCGAGAAGCACTCAGTAACAAGGTGGATGAGTTGGCTCATTTTCTGCTCCGCAAGTATC 3364 

Qy 4233 GAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGTCATCAAAAATTACAAGC 4292 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 3365 GAGCCAAGGAGCTGGTCACAAAGGCAGAAATGCTGGAGAGAGTCATCAAAAATTACAAGC 3424 

Qy 4293 ACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTG 4352 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II IE I I I I I I I I I I I I 
Db 3425 GCTGCTTTCCTGTGATCTTCGGCAAAGCCTCCGAGTCCCTGAAGATGATCTTTGGCATTG 3484 

Qy 4 353 ACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCT 4 412 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II II I 
Db 3485 ACGTGAAGGAAGTGGACCCCACCAGCAACACCTACACCCTTGTCACCTGCCTGGGCCTTT 3544 

Qy 4413 CCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTG 4472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3545 C C TAT GAT GGC C TGC TGGG TAATAATC AGATC T T T C C C AAGAC AGGCC T TC T GATAATC G 3604 
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Qy 

Db 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


4473 TCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGC 4532 

I I I I I I II I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 
3605 TC C TGGGC AC AATT GC AAT GGAGGGC GAC AGC GCC T C TGAGGAGGAAAT C T GGGAGGAGC 3664 

4533 TGAGT GT GATGGAGGT GT ATGAT GGGAGGGAG CAC AGTGC C TAT GGGGAGC C C AGGAAGC 4592 

II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
3665 TGGGTGTGATGGGGGTGTATGATGGGAGGGAGCACAC TGT C TAT GGGGAGC C CAGGAAAC 3724 

4593 TGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTG 4 651 

I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

3725 T GC T CAC C C AAGAT T GGGT GC AGGAAAAC TAC C T GGAGT AC C GGC AGG TAC C C GGC AGT A 3784 

4 652 ATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGA 4711 

I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I M II I I I I I I I I II I I I I I I I I I 
3785 ATCCTGCGCGC TATGAGTTCCTGTGGGGTCCAAGGGCTCTGGCTGAAACCAGCTATGTGA 3844 

4 712 AAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGC 4771 

I I I I I I I III I I I I I III Mill I I I I I I I I I I I I I I I II I I I I I I I IE I I 
3845 AAGTCCTGGAGCATGTGGTCAGGGTCAATGCAAGAGTTCGCATTGCCTACCCATCCCTGC 3904 

4772 GTGAAGC AGCT TTGAGAGAGGAGGAAGAGGGAGTC T GAGC ATGAGTTGCAGC CAAGGCCA 4831 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I IN 
3905 GTGAAGCAGCT TTGT TAGAGGAGGAAGAGGGAGTCTGAGCATGAGTTGCAGCCAGGGCTG 3964 

4832 GTGGGAGGG GGAC T GGGC C AGT GC AC C T T C C AGGGC C G C GT C CAGC AGC T T CC C C T 48 87 

I I I I I I I I I I M I I I I I I I I I I I II III I I I I I I I I I I I I I I I 

3965 TGGGGAAGGGGCAGGGCTGGGCCAGTGCATCTAACA — GCCCTGTGCAGCAGCTTCCCTT 4022 

4888 GCCTCGTGTGACATGAGGCCCATTCTTCACTC TGAAGAGAGCGGT CAGTGT TC TCA 4943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4023 GCCTCGTGTAACATGAGGCCCATTCTTCACTCTGTTTGAAGAAAATAGTCAGTGTTCTTA 4082 

4 944 GTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATT 5003 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4083 GTAGTGGGTTTCTATTTTGTTGGATGACTTGGAGATTTATCTCTGTTTCCTTTTACAATT 4142 

5004 GT T C AAAT GT T T T T T T T T AAGGGAT GGT T GAATGAAC T T CAGC AT C C AAGT T TAT GAAT G 5063 

III I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4143 GTTGAAATG-TTCCTTTTAATGGATGGTTGAATTAACTTCAGCATCCAAGTTTATGAATC 4201 

5064 ACAGC AG T C AC AC AG T T C T GTGT AT ATAGT T T AAGGGTAAGAGTC T TG TGT T T T AT TC AG 5123 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4202 GTAGTTAACGTATATTGCTGTTAATATAGTTTAGGAGTAAGAGTCTTGTTTTTTATTCAG 4261 

5124 ATTGGGAAATCCATTCTATTTTGTGAATTGGG ATAATAACAGCAGTGGAATAAGTAC 5180 

I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I 
42 62 AT T GGGAAAT C C GT T C TAT T T T GT GAAT T T GGGAC AT AAT AAC AGC AG TGGAGTAAGT AT 4 321 

5181 T T AGAAAT GT GAAAAATGAGC AG T AAAAT AGAT GAGAT AAAGAAC T AAAGAAAT TAAGAG 5240 

I I I I I I II II III I I I II I I I I I I I I I I I I I I I I I I I 

4322 TTAGAAGTGTG AAT TC AC C G T GAAAT AG GT GAGAT AAATTAAAAG 4366 

5241 AT AGT C AAT T C T T GC C T TAT AC C T C AGT C TAT T C TG T AAAAT T T T T AAAGAT AT AT GC AT 5300 

III I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
4 367 AT AC T T AAT T C C C GC C T TAT GC C T C AGT C TAT T C TG TAAAAT T T AAAAAT AT AT AT GC AT 4 42 6 

5301 ACCTGGATTTCCTTGGCTTCTTTGAGAATGTAAGAGAAATTAAATCTGAATAAAGAATTC 5360 

I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I 
4427 ACCTGGATTTCCTTGGCTTC GTGAATGTAAGAG AAAT TAAATCTG AAT AAAT AAT TC 4483 
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Qy 5361 TTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCT 5420 

II I I I I I I I 1 I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4484 TTTCTGTTAACTGGCTCATTTCTTCTCTATGCACTGAGCATCTGCTCTGTGGAAGGCCCA 4 54 3 

Qy 5421 GGG T TAG T AGTGGAGAT GC TAAGG TAAGC C AGAC TC ATAC C C AC C C AT AGGG TCGT AGAG 5480 

II I I I I I I I I I I I I I I III I I I I I I I I I I I I II III III I I I I I I I II 
Db 4544 GGAT TAG T AGTGGAGAT AC TAGGGTAAGCCAGACAC ACAC C TAC C GAT AGGG TAT TAAGA 4603 

Qy 5481 TC T AGGAGC TGCAGT CACGTAATC GAGGTGGC AAGATGTC C TCT AAAGATGTAGGGAAAA 5540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4604 GTC TAGGAGCGCGGT CATATAAT TAAGG TGAC AAGATGTC C TCT AAGATGTAGGGGAAAA 4 663 

Qy 5541 GTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGA 5600 

II I I III I I I I I I I I I I I I I I I I I I I I I I I II I I I I I III I I I I I 

Db 4664 GT AACGAGTGTGGGTATGGGGCTCCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGT 4719 

Qy 5601 GCTGGGGCATTTTGGGCTTTGGGAAAC TGCAGT TCCTTCTGGGGGAGCTGATTGTAATGA 5660 

I I I I I I I I I I I ! I M I I I I I I I I I I I II II I I I I I I M II MINI I I II I I 
Db 4720 G-TGGGGCCTTTTGGGCTTTGGGAAACTCCATTTTCTTCTGAGGGATCTGATTCTAATGA 4778 

Qy 5661 TCTTGGGTGGATCC 5674 

I I I I I I III 
Db 477 9 AGCTTGGTGGGTCC 47 92 


RESULT 9 
ABQ76206 

ID ABQ7 6206 standard; DMA; 4736 BP. 
XX 

AC ABQ76206; 
XX 

DT 21-OCT-2002 (first entry) 
XX 

DE Human tumour antigen MAGE- 5b DNA. 
XX 

KW Tumour antigen; human; vaccine; cellular immune response; immunogen; 

KW cancer; tumour; MAGE- 5b; ds . 

XX 

OS Homo sapiens . 
XX 

PN US6287569-B1. 
XX 

PD ll-SEP-2001. 
XX 

PF 06-APR-1998; 98US-00056105 . 
XX 

PR 10-APR-1997; 97US-00434 67P . 
XX 

PA (REGC ) UNIV CALIFORNIA. 
XX 

PI Kipps TJ, Wu Y; 
XX 

DR WPI; 1998-583198/49. 
XX 

PT Generating cellular immune response in patient to target protein - 

PT comprises introducing vector with nucleotide sequence encoding immunogen 

PT comprising protein processing signal into cell of patient. 

XX 

PS Disclosure; Col 54-58; 61pp; English. 
XX 

CC This invention describes a novel method for generating a cellular immune 
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CC response in a patient to a target protein or its fragment. The method 

CC involves introducing a vector containing a nucleotide sequence encoding a 

CC chimeric immunogen comprising a protein processing signal and the target 

CC protein or its fragment. The immunogen is produced by the cells and 

CC processed so that the target protein or its fragment is presented to the 

CC patients immune system and a cellular immune response is initiated. The 

CC method and vectors can be used as a form of vaccination and could be used 

CC to generate a cellular immune response in patients to, e.g. cancerous 

CC tumours. The cellular immune response is the predominant immune response 

CC in the patient. This sequence represents a DNA fragment which encodes the 

CC human tumour antigen MAGE- 5b described in the method of the invention. 

CC Note: The information in this spec has been previously disclosed in 

CC W0199845444 however this spec contained no sequence information 

XX 

SQ Sequence 4736 BP; 1114 A; 1278 C; 1304 G; 1040 T; 0 U; 0 Other; 

Query Match 42.8%; Score 2429.6; DB 2; Length 4736; 

Best Local Similarity 75.9%; Pred. No. 0; 

Matches 3736; Conservative 0; Mismatches 869; Indels 315; Gaps 47; 


Ov 
Db 

715 
15 

TTCCCGCCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGG 

III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 
TTCAACCCAGGGAATCCCTGGGTGACCAGATGTGGTGCCACTGTCTTGCACATTTGAGGT 

774 
74 

Qv 
Db 

775 
75 

C AGAGAGAAGC GAGG T T T C CAT T C T GAGGGAC GGC G TAGAGT T C GGCC GAAGGAAC C T GA 

1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CGGAGAGAAGCAAGGGCCTCGCTCTCAGGGGCAGC-TGGAGATCAGCTGAGGGCAGCTGG 

834 
133 

Qv 
Db 

835 
134 

CCCAGGC TC TGTGAGGAGGCAAGGTGAGAGGC TGAGGGAGGAC TGAGGACCC CGCC AC TC 
III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
C C C T GGC T C T GT GAGGATGC AAGG T GAG AT GC T GAG GGAG GAC T AAGG AGT AT C C C AC C C 

894 
193 

Qy 
Db 

895 
194 

C AAAT AG AGAG C C C C AAAT AT T C C AG CCCCGCCCTTGCTGCCAGCCCTGGCCCACCC 

1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CTGGTAGTGGACCCCAAATAATCCAGTGCCACCTCTCCTGCTGCTAGCTCTGGACCATCC 

951 
253 

Qy 

Db 

952 
254 

GCGGGAAGACGTCTCAGCCTGGGCTGCCCCCAGACUUOIGC IC^AAAACjUU 1 l(jAbA(j/\U 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 III 

AGGGCAGGACTTCTTAGGCTGGGCCACCCCCAGTCCCCCACCGCTTAAGCCGCAGGGGA- 

i ni 1 

± V L 1 

312 

Qy 

Db 

1012 
313 

ACCAGGT TCTTCTCC CC AAGC TC T GGAAT CAGAGGT TGCT GTGAC C AGGGC AGGAC TGGT 

III III 1 1 1 1 1 III 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
C T C AGGAGAC AGAGC T T GGT AT GAC C AGGGC AGGAC TGGT 

1071 
352 

Qy 

1072 

TAGGAGAGGGC AGGGCACAGGC TC TGCC AGGC ATCAAGAT CAGC ACCC AAGAGGGAGGGC 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TAGGAGAGGAC AGCT CCCA- GC TC TGC C AGGAAACAACGTC AGGAACC TAAGGGAAAGC T 

1131 

Db 

353 

411 

Qy 

1132 

TGTGGGCCCCCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCC 

1191 

Db 

412 

1 1 1 1 1 

GAGGCTACCCC 

422 

Qy 

1192 

CACCCAACCCCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCAC 

1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 
CACCCCAAACTCTATTCCTGTCCCTACCTCCGTCC 

1251 

Db 

423 

457 

Qy 

1252 

CTGACCACCACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACT 

1 III 1 1 1 1 1 1 II II II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 
CCCACCTACACCCCCCATTCC CCCACCCCTTCCCTACCGGCACCTCTATCCCACA 

1311 

Db 

458 

512 

Qy 

1312 

GCCCCCAACCCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTG 

1371 
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MINI M 

Db 513 TCCCCCA CCCCTATCCTG 530 

Qy 1372 GCAGAATCCGGTT-TGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAA 1430 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 531 GCAGAATCCGATTCTGCCCCTGATTTCAACCCAGGGAAGCCCTAGGGGGCCGGATGTGAT 590 

Qy 14 31 ACC AC TGAC T T GAAC C TC AC AGAT C T GAGAGAAGC C AGGT T CAT T T AAT GGT T C TGAGGG 1490 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M 

Db 591 GC T GCTGAC T T GTGC AT T GGGGGT C AGAGAGAATC AAGG GCATGGTTCTGAGAA 644 

Qy 14 91 GC GGCT T GAGATC C AC T GAGGGGAGTGGT T TT AGGC T C TGTGAGGAGGC AAGGT GAGATG 1550 

Mi I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I 

Db 645 GCC GAC T GAGATCAGC AGAGGGGAATGGGCCC GGGC TC TGTGAGGAGGCAAGGTGAGACC 704 

Qy 1551 C T - GAGGG AGGAC TGAGGAGGC AC AC AC CCC AGGT AGATGGC CC C AAAAT GAT CC AG T AC 1609 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 705 CCC GAGGAAGGAATGAGGAAGCC C TC AC C C — AGAT AGAGAAC C C C AAAT AAT C C AG T AC 762 

Qy 1610 C AC C C C T GC TGC C AGC CC T GGAC C AC C C GGC C AGGAC AGAT GTC T C AGC T GGAC C AC CCC 1669 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II 

Db 763 TACCTCTGCTGCCAGCCCTGGACCAC CCAGGGC AGAC T T C TC AGGC T GAAC CT TC C 818 

Qy 1670 CCGTCCCGTCCCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTT-ATGTGAC 1728 

I Ml I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 819 C C C C T C C C C AC T GC C AC T T AAGC C AC AAGGG AC T C T GGAG T C AGAC C T T GG T GT G AC 875 

Qy 172 9 CGGGGC AGGGT TGGT C AGGAGAGGC AGGGC CC AGGC ATC AAGGT CC AGC AT CCGCCC GGC 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db . 87 6 CAGGGAAGGGCCGGTCAGGAGAGG GCAGGGGCCAGGCTCTGTCAGGC 922 

Qy 1789 AT T AGGG T C AG GACC C TGG GAGGGAAC T GAGGG T T C CC C AC C C AC AC CTGTCTCC T C AT C 1848 

III I I I I I I I I I I I I I I I I I I I I I I I III I I I I II IE I 

Db 923 ATC AAAATCAGGACC C TGAGAGAGAAT T GAGGGCCC CC ACCCCAACCC CTAT ACC C ATCC 982 

Qy 1849 TCCACCGCCACCCCACTCACATTCCCATACCTACC CCCTACCCCCAACCTCATCTT 1904 

I I I I I I I I I I I II I III II I I I I I I I I I I I I I I I I I 

Db 983 CTAACCCCATACCCACTCTACTTGCATTCCCAGCCCCATCCCCACACCCTACCCCATCTT 1042 

Qy 1905 GTCAGAA TCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGG 1954 

I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 104 3 GGC AGAAT CTGTTTCTTTCCCT GC AGTC AAC C C AC AGAAG CC CC AGGAATGAC AGAC AGG 1102 

Qy 1955 CACTCGGATCTTGACGTCCCCATCCAGGGTCTGATGGAGGGAAGGG GCTTGAA 2007 

I I I I II I II I I I I I I I I I I I I I I I.I I I I I I I I I I I I 

Db 1103 CACACCCATTCTGACGTCCACATCCAGGGCTGAAGGAGGGAAAGGGCTTAGTATCATGAG 1162 

Qy 2008 CAGGGCC TCAGGGGAGCAGAGG GAGGGC C C T AC T GC GAGATGAGGGAGGC C TC AGA 2063 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1163 CAGGGCC TCAGGGGAGTCTCTGCTCCTCAAGCCCTGCTGGGAGTAAAGGGAGGCCTCAGG 1222 

Qy 2064 GGAC C C AGC AC CC T AGGA CACCGCACCCCTGTCTGAGACTGAGGC--TGCC 2112 

I I I I I I I II I I I I Ml I I I I I I I I I I I I I I I I I I I I I II 

Db 1223 GAAC C C AGG T C C T C AGGAT AGGGGGTC C AC T C C AAC C C T G T C T GAGAC T GAGGC GC C TC C 1282 

Qy 2113 AC TTCTGGCCT C AAG AAT C AGAAC GAT GGGGAC T C AGAT T GC AT GGGG GT GGGACC C AGG 2172 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1283 TCTTTCATCCTCGGGAATCACAGGGATGGAGACTCACGTCAGCAGAGGGTGGGGCCCAAC 1342 

Qy 2173 C C T GC AAGGC T T AC G C GGAGGAAGAGGAGGGAGGAC T C AG GGGAC C T T GGAATC C AGAT C 2232 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II MINI I 
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Db 1343 CCTGCC AGGATC AAGGAGAGGAAGAAGAGGGAGGAC TCAGGGTACC TT TGAG TCCAGAAC 1402 

Qy 2233 AGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATGGCCCATATTTCC 2292 

I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1403 AATGGGGACCTTTGCCCTGGGAGGTCCAGTGCACAGTGGCCACCTGTAGCCCATGCTTGC 14 62 

Qy 2293 T GC AT C T T TGAGGT GAC AGGACAGAGCTGTGGTCTGAGAAGTGGGGCCTCAGGTCA 2348 

I I I I III I I I I I I I I I I II I I I I I I I I I III Mill I I I I I I I I I I 

Db 14 63 TGC ACCT TC TGGGTGACAAAGAGGAGAGGGCTGTGGTCAGAGCAGTGGTGAC TCAGGTCA 1522 

Qy 2349 AC AGAGG GAGGAGT T CC AGGATC CAT AT GGC C C AAG ATGT GCC C CC T T C ATGAGGAC TGG 2408 

I I I I I I I I I I I I I I I I I Ell I I I I I I I I I I I I I I I I I I I I I I II III 
Db 1523 GCAGAGGGAGGAGTCCCAGCATCTGCAGGCCCCAATGTGTGCCCCATTCATGAAGATTGG 1582 

Qy 2409 GGATATC C C C GGC TC AGAAAGAAGGGAC T C C AC AC AGTC T GGC TGTCCCCTTT TAG TAGC 24 68 

III I II I I I I I I I I II I II I II I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1583 GGAC A- C C T T G GC TC AGAAAGAAGGGAC C C C AC AGAGT C TGGC T GT C C C C TGAT T T T TGC 1641 

Qy 2469 TCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCACAGGCAGG 2528 

II I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I 

Db 1642 TC AGAGG GGAC CAAATCAAGGATAGCCC TATGTGCC AACC TCAT TTGTGCC ACAGGAAAG 1701 

Qy 2529 AAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCTACTCATGT 2588 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I III I I I I I I 
Db 1702 AAGT T GAAGAGC C C T C AGGGT GAT GGGG T C T TGC AG T AAAGGGGAGC T ATC T GC T C ATC T 17 61 

Qy 2589 C AGGGAAT T GGGGGT TGAGGAAGC AC AGGC GC T GGC AGGAAT AAAGAT GAGT GAGAC AGA 2648 

I II I I II I I I I I I II I I I I I I I I I I I I I I II II 
Db 17 62 C AGGGGG T T T C AGGT TGAGGAAT GGC AGGC C C C AT C AC GATGAAGAGT AAC C C AC AGG — 1819 

Qy 2649 CAAGGCTATTGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACACCTCA 2703 

II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1820 AGCC AT AGAAAC AC T C AC C C C AGAAC C AAAGGGGTC AT AC C T GGAC AC C C CAT G TGG 1876 

Qy 2704 CCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACC 2759 

I I I I I I I I III I I III I I I I I I I I I I I I I I I III I I I I I I I I I I 
Db 1877 GGGTGACAGGATGTAGCT -CCATC TCAT TCCTGTTT TCAGATCTCGGGGAGGTGAGGAAC 1935 

Qy 2760 T CAT T C T C AGAGGGT GAC T C AGGT CAAC GT AGGGAC C C C CATC T GGTC TAAAGAC AGAGC 2819 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1936 TTGTTCTCC GAGGAT GAC T C AGGT CAAC AC AGGGGC C C C C ATC T GGTGGATAGAC AGAGT 1995 

Qy 2820 GGT C C C AGGAT C TGC C AT GC GT TC GGGT GAGGAACATGAGGGAGGAC T GAGGGT AC C CC A 287 9 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1996 GGT C C C AGGAT C TGT C AGT AGT T C CGGT GAGGAAC AT GAGGGAC GAT T GAGGGC AC C C T T 2055 

Qy 2880 GGAC C AG AAC AC TGAGGGAGAC T GC AC AGAAAT C AGC C C T GCC C C TGC T GT C AC CC C AGA 2 939 

II I I I I I I I I I II I III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2056 GGGC C AG AAC AC AGATGAG GAC C T C AC GGAAAT CTGCCCTGCCCC TGC T GTC AC TC C AGA 2115 

Qy 2940 GAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCC — GTTATCCTGGGATCATTGATGTCA 2997 

I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I 
Db 2116 GAGCATGGGCAGGGCTGTCTGCTGCAGTCCCCCCCACTTACCCTGGGATCATTGGTGTCA 2175 

Qy 2998 GGGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAG 3057 

I II I I I I I I I III III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2176 GTGATGGGGAGGTCTTTGTC-GAGGGGTCTGCACTCAGGTCAGTAGAGGGAGCGTCTTAG 2234 

Qy 3058 GCCCTGCCAGGAGTCAAGGTGAGGACCAAGCGGGCACCTCACCCAGGACACATTAATTCC 3117 

I I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2235 GC C C T GC C AGGAGAC AAGG T AAGAAC GAAGC AGG T T CC TC AC C C AGGAC AC ATGAAT T C C 22 94 
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Qy 3118 AAT GAAT T T TGATAT CTCTTGCTGCCCTTCCC C A- AGGAC C TAGGC ACG T GT GGC C AGAT 317 6 

I I I I I I I I I I I I I I I III I I I II II I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2295 AATGCATTTCAGCATCTCTTCCTGTCCTTCCCAAGAGGACCTGGGCACGTGTGGCCAGAT 2354 

Qy 3177 GTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTC 3236 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2355 GTGAGTCTCCTCATGTCCT GTTCCCTATCAGGGATGTGAGCTCTTAATCTGAGTTTC 2411 

Qy 3237 TCAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTG 3296 

I I I I I I I I I I I I I I M I I I I II I II I I I I I I I I I I III I I I I I I I I I I III 
Db 2412 TCAGGCCAGCAAAAGGGTGGGATCCAGGCCTTGCCAGGAGAAAGGTGAGGGCCCTGTGTG 24 71 

Qy 3297 AGAAC AGAGGGGGTC AT CC AC TGC ATGAGAGT GGGGATGT C AC AGAGTC C AGC C C AC CC T 3356 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2472 AGC AC AG AGGGGAC C AT TC AC CC C AAGAGGGT GGAGAC C T C AC AGAT TC C AGC C T AC CC T 2531 

Qy 3357 CCTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGAT 3416 

I I I I I I I I I I I I I A I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I 
Db 2532 C C T GT T AGC AC T GGG GGC C TGAGGC T G T GC T T GC AG TC T G C AC C C T G AGGGC C CAT GC AT 2591 

Qy 3417 TCC TC T T CCTGGAGC TCCAGGAAC CAGGC AGTGAGGCC TT GGTC TGAGACAG TATC C TCA 3476 

I I I I I II I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2592 TCCTCTTC C AGGAGC T C CAGGAAACAGAC AC TGAGGC C T T GGTC TGAGGC C G TGC C C TCA 2 651 

Qy 3477 GGTCACAGAGCAGAGGATGCACAGGGT GTGCCAGCAGTGAATGTTTGCCCTGAATG 3532 

I I I I I I I I I I I I I II I I III I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2652 GGT C AC AGAGC AGAG GAGAT GC AGAC GT C T AGT GC C AGC AGT GAAC GT T T GC C T T GAAT G 2711 

Qy 3533 C AC AC C AAGGGC C C C AC C T GC C AC AGGAC AC AT AGGAC T C C AC AGAG T C T GGC C T C A- C C 3591 

I I I I I II I I I I I I III III III II I I I I I I I I II MINIM || 

Db 2712 C AC AC T AAT GGC C C C CAT C GC CC C AGAAC ATAT GGGAC T C C AGAGC AC C T GGC C T C ACC C 2 771 

Qy 3592 TCCCTACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTC 3651 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I M I 

Db 2772 TCTCTACTGTCAGTCCTGCAGAATCAGCCTCTGCTTGCTTGTGTACCCTGAGGTGCCCTC 2831 

Qy 3652 TC AC TTCCTCCTT C AGGT T T TC AGGGGAC AGGC C AAC C C AGAGGAC * A 3698 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I Ml M M I 

Db 2832 TC AC TTTT TCC TTC AGGT TCTC AGGGGAC AGGC TGACCAGGATC AC CAGGAAGCTCCAGA 2891 

Qy 3699 GGAT T CC C T GG AGGC C AC AGAGGAGC AC C - AAGGAGAAGATC T GTAAG TAGGC C T T T GT T 3757 

II II III I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I 

Db 2892 GGATC CC C AGG AGGC CC TAGAGGAGC AC C AAAGGAGAAGAT C TG T AAG T AAG CCTTTGTT 2951 

Qy 3758 AGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGC 3817 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I II I II 
Db 2952 AGAGCCTCCAAGGTTCAGTTTTTAGCTGAGGCTTCTCACATGCTCCCTCTCTCTCCAGGC 3011 

Qy 3818 CTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTC 3877 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I M I I I III II I I I I I I I I 

Db 3012 C AGTGGG TC TC C ATT GCCC AGC TCC TGC CCAC AC TCC TGC CTGTTGCGGTGACC AGAGTC 3071 

Qy 3878 AT C AT GT C T C T T GAGC AGAGGAGT C T GC AC TGC AAGC C TG AGGAAGC C C T TGAGGC C C AA 3937 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I M 
Db 3072 GT C AT GT C TC T T GAGCAGAAGAGT C AGC AC T GC AAGC C T GAGGAAGGC C T T GAC AC C C AA 3131 

Qy 3938 CAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC C 397 6 

I I II I I II I I I I I I I I I I I I I I I II II I II II M M 
Db 3132 GAAGAGGCCCTGGGCCTGGTGGGTGTGCAGGCTGCCACTACTGAGGAGCAGGAGGCTGTG 3191 
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Qy 3977 TCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACA 4036 

I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3192 TCCTCCTCCTCTCCTCTGGTCCCAGGCACCCTGGGGGAGGTGCCTGCTGCTGGGTCACCA 3251 

Qy 4037 GAT CC T C C C C AGAGT C C TC AGGGAGC CTCCGCCTTTCC C AC T AC C ATC AAC T TC AC TC GA 4096 

I I I I I I I I I I I I I I I I II I 1 I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 3252 GGTCCTCTCAAGAGTCCTCAGGGAGCCTCCGCCATCCCCACTGCCATCGATTTCACTCTA 3311 

Qy 4097 CAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGT 4156 

I I I I I I I III I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I II I 

Db 3312 TGGAGGC AATCCAT T AAGGGC TCC AGCAACCAAGAAGAGGAGGGGCCAAGCACC TC CCC T 3371 

Qy 4157 ATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTT 4216 

II I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I III II I I I I 

Db 3372 GAC C C AGAGT C TGTG T TCC GAGC AGC AC TC AG TAAGAAGG TGGC TGAC T T GATT C AT T T T 34 31 

Qy 4217 CTGCTCCT C AAAT AT C GAGCCAGGGAGC C AGT C AC AAAGGC AGAAAT GC T GG AGAG TGT C 4276 

I I I I I I I I I I I III II II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I III 
Db 34 32 CT G C TC C T C AAGT AT T AAG T C AAGGAGC C GGT C AC AAAGG C AGAAAT GC T GGAGAGC GT C 34 91 

Qy 4277 AT C AAAAAT T AC AAGC AC T GT T T T C C TGAGAT C T T C GGC AAAGC C T C T GAGT CC T T GC AG 4336 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 34 92 AT C AAAAAT T AC AAGCGC T GC T T T CC TGAGAT C T T C GGCAAAGC C T C C GAGT CC T T GC AG 3551 

Qy 4337 CTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTC 4396 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I 
Db 3552 CTGGTCTTTGGCATTGACGTGAAGGAAGCGGACCCCACCAGCAACACCTACACCCTTGTC 3611 

Qy 4 397 AC C T GCC TAGG TC TC TCC TAT GAT GGC C TGC T GGGT GATAATC AGAT C AT GC C C AAGAC A 4456 

I I I I I I I I II I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 
Db 3612 ACCTGCCTGGG — ACTCCTATGATGGCCTGGTGGTT — TAATC AGAT C ATG C CC AAGAC G 3667 

Qy 4457 GGC T T C C T GAT AAT TG TC C TGG TC ATGAT T GC AAT GGAGG GC GG CC AT GC T C C T GAGGAG 4516 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3668 GGCCTCCTGATAATCGTCTTGGGCATGATTGCAATGGAGGGCAAATGCGTCCCTGAGGAG 3727 

Qy 4 517 GAAATC T GGGAGGAGC T GAGTGTGAT GGAGGT GT AT GAT GGGAGGGAG C AC AGT GC C TAT 4 57 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 3728 AAAATCT GGGAGGAGC TGGGTGTGATGAAGGTGTATGTTGGGAGGGAGCACAGTGTC TGT 3787 

Qy 4577 GGGGAGC CCAGGAAGC TGC TCACC CAAGAT TT GGTGCAGGAAAAGTAC C TGGAGTACGGC 4636 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3788 GGGGAGC C C AGGAAGC TGC TCACC CAAGAT T T GGT GC AGGAAAAC T AC C T GGAGTAC C GC 3847 

Qy 4637 AGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTG 4 696 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3848 AGGTGCCCAGCAGTGATCCCATATGCTATGAGTTACTGTGGGGTCCAAGGGCACTCGCTG 3907 

Qy 4697 AAAC C AGC TAT G T GAAAGT C C T TGAGTAT GT GATC AAGG T C AGT GC AAGAG TTCGCTTTT 4756 

I I I I I I I IE III I III III I I I I I I I I I I I I I I I I I III 
Db 3908 CT TGAAAGTACTGGAGCACGTGGTCAGGGTCAATGCAAGAGTTCTCATTT 3 957 

Qy 4757 TC T TCCC ATCC C TGCGTGAAGCAGC T T TGAGAGAGGAGGAAGAGGGAGTCTGAGCATGAG 4816 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 3958 C C T AC C C ATC C C T GC ATGAAGC AGC T T T GAGAGAGGAGG AAGAG GGAGT C T GAGC AT GAG 4017 

Qy 4817 TTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAG 4876 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4018 CTGCAGCCAGGGCCACTGCGAGGGGGGCTGGGCCAGTGCACCTTCCAGGGCTCCGTCCAG 4077 

Qy 4877 CAGCTTCCCCTGCC-TCGTGTGACATGAGGCCCATTCTTCACTC — T GAAGAGAGC GG T C 4933 
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II 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III II 1 1 1 1 1 1 1 1 III 

Db 4078 TAGTTTCCCCTGCCTTAATGTGACATGAGGCCCATTCTTCTCTCTTTGAAGAGAGCAGTC 4137 

Qy 4 934 AGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTC 4 993 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IE I I I I I I I I I 
Db 4138 AACATTCTTAGTAGTGGGTTTCTGTTCTATTGGATGACTTTGAGATTTGTCTTTGTTTCC 4197 

Qy 4 994 TTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAG 5053 

I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I III 
Db 4198 TTTTGGAATTGTTCAAATG-TTCCTTTTAATGGGTGGTTGAATGAACTTCAGCATTCAAA 4 256 

Qy 5054 T T T ATGAAT GAC AGC AGT C AC AC — AGT T C TG T GT AT AT AG T T TAAGGGT AAGAGT C T T G 5111 

I I I I I I I I I I II I I I I I I I I I I III I II I I I I I I I M M I I I I I I I I I I I I I I 
Db 4257 T T T ATGAAT GAC AGT AGT C AC AC AT AGT GC TG T T TAT AT AG T T TAGGAGT AAGAGT C T T G 4316 

Qy 5112 TGT T T TAT T C AGAT T GGGAAAT C C AT TC TAT T T TGT GAAT T GGG — AT AAT AAC AGC AG T 5169 

I I I I I I I I I II 1 I I II I I I I I I I I I I I M I II I I I I I I I I I I III I I I I I I II I 
Db 4317 T T T T T T ATT C AGAT T GGGAAAT C C AT TC C AT T T TGT GAAT T GGGAC AT AGT T AC AG C AGT 4376 

Qy 5170 GGAATAAGT AC T TA- GAAAT GT GAAAAATGAGC AGT AAAAT AGAT GAGATAAAGAAC TAA 5228 

I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I III 
Db 4377 GGAATAAGT AT TC AT T TAGAAATG TGAATGAGC AGT AAAAC TGAT GAGA TAA 4 428 

Qy 5229 AGAAAT T AAGAGAT AGTC AAT T C T T GC C T T AT ACC T C AGTC T AT T C T G T AAAA — TTTTT 528 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I 
Db 4429 AGAAAT TAAAAGATATTTAATTCTTGCCTTATA-CTCAGTCTATTCGGTAAAATT TTTTT 4487 

Qy 5287 AAAGAT AT ATGC AT AC C T GGAT T T C C T T GGC T T C T T TGAG AAT G TAAG AGAAAT T AAAT C 5346 

I I II I I I I I I I I I I I I I I I M M I I I I I I I I I I I II I I I I I I I I M I I I I I I I I 
Db 4488 T T AAAAATGT GC AT AC C T GGAT T T C C T T GGC T T CT T TGAG AATG TAAG AC AAAT T AAAT C 4 547 

Qy 5347 TGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCT 5406 

I I I I I I I I Mill I I I I I I II I I I I I I I III I I I I I I I I I M I I I I I I I I II I 
Db 4548 TGAATAAATCATTCTCCCTGTTCACTGGCTCATTTATTCTCTATGCACTGAGCATTTGCT 4 607 

Qy 5407 T T T TGGAAGGC C C TGGGT T AGT AG T GGAGATGC T AAGGT AAGC C AGAC T CAT AC C C AC C C 5466 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II II II 
Db 4 608 CTGTGGAAGGCCCTGGGTTAATAGTGGAGATGCTAAGGTAAGCCAGACTCACCCCTACCC 4 667 

Qy 5467 ATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAA 5526 

I I I I I I III I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 668 AC AGGG T AG TAAAGT C TAGGAGC AGC AG T C AT AT AATTAAGGTGGAGAGATGC C C T C TAA 4 727 


RESULT 10 
ABQ76205 

ID ABQ76205 standard; DNA; 4741 BP. 
XX 

AC ABQ7 6205; 
XX 

DT 21-OCT-2002 (first entry) 
XX 

DE Human tumour antigen MAGE- 5 a DNA. 
XX 

KW Tumour antigen; human; vaccine; cellular immune response; immunogen; 

KW cancer; tumour; MAGE- 5a; ds . 

XX 

OS Homo sapiens . 
XX 

PN US6287569-B1. 
XX 
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PD ll-SEP-2001. 
XX 

PF 06-APR-1998; 98US-00056105 . 
XX 

PR 10-APR-1997; 97US-004 34 67 P . 


XX 

PA (REGC ) UNIV CALIFORNIA. 
XX 


PI Kipps TJ, Wu Y; 
XX 

DR WPI; 1998-583198/49. 
XX 

PT Generating cellular immune response in patient to target protein - 

PT comprises introducing vector with nucleotide sequence encoding immunogen 

PT comprising protein processing signal into cell of patient. 

XX 

PS Disclosure; Col 49-54; 61pp; English. 
XX 

CC This invention describes a novel method for generating a cellular immune 

CC response in a patient to a target protein or its fragment. The method 

CC involves introducing a vector containing a nucleotide sequence encoding a 

CC chimeric immunogen comprising a protein processing signal and the target 

CC protein or its fragment. The immunogen is produced by the cells and 

CC processed so that the target protein or its fragment is presented to the 

CC patients immune system and a cellular immune response is initiated. The 

CC method and vectors can be used as a form of vaccination and could be used 

CC to generate a cellular immune response in patients to, e.g. cancerous 

CC tumours. The cellular immune response is the predominant immune response 

CC in the patient. This sequence represents a DNA fragment which encodes the 

CC human tumour antigen MAGE- 5 a described in the method of the invention. 

CC Note: The information in this spec has been previously disclosed in 

CC W0199845444 however this spec contained no sequence information 


XX 

SQ Sequence 4741 BP; 1118 A; 1274 C; 1305 G; 1044 T; 0 U; 0 Other; 


Query Match 42.7%; Score 2422.8; DB 2; Length 4741; 

Best Local Similarity 75.7%; Pred. No. 0; 

Matches 372 6; Conservative 0; Mismatches 882; Indels 314; Gaps 46; 


Qy 

715 

TTCCCGCCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGG 

774 



III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 


Db 

15 

TTCAACCCAGGGAATCCCTGGGTGACCAGATGTGGTGCCACTGTCTTGCACATTTGAGGT 

74 

Qy 

775 

C AGAGAG AAGC GAGG T T TC CAT TC T GAGGGAC GGC G T AGAGT T CGGC C GAAGGAAC C TGA 

834 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

75 

CGGAGAGAAGCAAGGGCCTCGCTCTCAGGGGCAGC-TGGAGATCAGCTGAGGGCAGCTGG 

133 

Qy 

835 

C C C AGGC TC T G T GAGGAGG CAAGG TGAGAGGC T GAGGGAGGAC T GAGG AC C C C GC C AC T C 

894 



III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

134 

C CC T GGC TC TG TGAGGAT GC AAGG T GAG AT GC T GAGGGAGGAC T AAGG AGTAT C C C AC C C 

193 

Qy 

895 

C AAAT AG AGAGC C C C AAAT AT T CC AG CCCCGCCCTTGCTGCCAGCCCTGGCCCACCC 

951 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 


Db 

194 

CTGGTAGTGGACCCCAAATAATCCAGTGCCACCTCTCCTGCTGCTAGCTCTGGACCATCC 

253 

Qy 

952 

GCGGGAAGACGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGAC 

1011 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 III 


Db 

254 

AGGGCAGGACTTCTTAGGCTGGGCCACCCCCAGTCCCCCACCGCTTAAGCCGCAGGGGA- 

312 

Qy 

1012 

ACCAGGTTCTTCTCCCCAAGCTCTGGAATCAGAGGTTGCTGTGACCAGGGCAGGACTGGT 

1071 


III III 1 1 1 1 1 III I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
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Db 313 C TCAGGAGACAGAGC TT GGTATGAC CAGGGCAGGAC TGGT 352 

Qy 1072 TAGGAGAGGGC AGGGCACAGGC TC TGCC AGGC ATCAAGATCAGC ACCC AAGAGGGAGGGC 1131 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 353 T AGGAGAGGAC AGC T C C C A- GC T C T GCC AGGAAAC AAC GTC AGGAACC T AAGGGAAAGC T 411 

Qy 1132 TGTGGGCCCCCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCC 1191 

I I I I I 

Db 412 GAG GC T AC C C C 422 

Qy 1192 CACCCAACCCCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCAC 1251 

I I I I I I I I I I I I I I I I I I I I 
Db 423 CACCCCAAACTCTATTCCTGTCCCTACCTCCGTCC 457 

Qy 1252 CTGACCACCACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACT 1311 

I III I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 

Db 4 58 CCCACCTACACCCCCCATTCC CCCACCCCTTCCCTACCGGCACCTCTATCCCACA 512 

Qy 1312 GCCCCCAACCCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTG 1371 

I I I I I I I I I I I I I I I 

Db 513 TCCCCCA CCCCTATCCTG 530 

Qy 1372 GC AGAAT C C GGT T - T GC CC C T GC T C TC AAC C C AGGGAAGC C C T GGT AGGC CC GATG T GAA 1430 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 531 GC AGAATCC GAT TC T GC CC C T GAT T TC AAC C C AGGGAAGC C C TAGGGGGCC GGATG T GAT 590 

Qy 14 31 AC C AC T G AC T T GAAC C T C AC AGAT C T GAGAGAAGC C AGGT TC AT T T AAT GGT T C TGAGGG 14 90 

I I I I I I I I I II I I I I I I I I I I I I M I I II I I II I I I 

Db 591 GC TGC TGAC T TGTGC ATTGGGGGT CAGAGAGAATCAAGG GCATGGTTCTGAGAA 644 

Qy 14 91 GC GGC T T GAGATC C AC TGAGGGGAGT GG T T T T AGGC T C T G T GAGGAGGC AAG G TGAGATG 1550 

II I I I I I I I I I I I I I I I I III I I I I II I I I I I I I I I I I I I I I I I I I 

Db 64 5 GC C GAC T GAGAT C AGC AGAGGGGAAT GG GC C C GGGC T C T G T GAGGAGGC AAGG TGAGACC 704 

Qy 1551 C T - GAGGG AGGAC TGAGGAGGC AC AC AC C C C AGGT AGAT GGC C C C AAAAT GAT C C AG T AC 1609 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 705 CCC GAGGAAGGAATGAGGAAGCC C TCAC CC - - AGATAGAGAACCC C AAATAATCCAGTAC 7 62 

Qy 1610 C AC CCC TGCTGCCAGCCCTGGACC ACCC GGCC AGGAC AGATGTCTC AGC TGG AC CAC CCC 1669 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II 

Db 7 63 TACCTTTGCTGCCAGCCCTGGACCAC C CAGGGC AG AC T T C T C AGGC T GAAC C T TC C 818 

Qy 1670 CCGTCCCGTCCCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTT-ATGTGAC 1728 

I Ml I I I I I I I I I I I I I II I I M I I I I I I I I I II I I I I I I I I I I I I 
Db 819 C C C C TC C CC AC TGC CAC T T AAGC C AC AAGGGAC T C T GGAG T C AGAC C T T GG T GT GAC 8 75 

Qy 172 9 CGGGGCAGGGTTGGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGC 178 8 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 876 CAGGGAAGGGCCGGTCAGGAGAGG GC AGGGGCC AGGC TCTGTC AGGC 922 

Qy 178 9 ATTAGGGTCAGGACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATC 184 8 

III I II I I I I I I II I I I I I I I I I I I I III I II I II II I 

Db 923 AT C AAAAT C AGGAC C C TGAGAGAG AAT T GAGGGC C C CC AC C C C AAC CC C T AT ACC C AT CC 982 

Qy 1849 TCCACCGCCACCCCACTCACATTCCCATACCTACC CCCTACCCCCAACCTCATCTT 1904 

Mil I I I II II III III II I I I I I I I I I II I I I I I I 

Db 983 CTAACCCCATACCCACTCTACTTGCATTCCCAGCCCCATCCCCACACCCTACCCCATCTT 1042 

Qy 1905 GTCAGAA TCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGG 1954 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I MINI I I II I I 

Db 104 3 GGC AGAATC TGTTTCTTTCCC TGC AGT C AAC C C AC AGAAGCC C C AGGAAT GAC AGAC AGG 1102 
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Qy 1955 CACTCGGATCTTGACGTCCCCATCCAGGGTCTGATGGAGGGAAGGG GCTTGAA 2007 

till II II I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1103 CAC ACC T AT TC TGAC GTCC ACATCCAGGGCTGAAGGAGGGAAAGGGC T TAGT ATCATGAG 1162 

Qy 2008 CAGGGCC TCAGGGGAGCAGAGG GAGGGC C C T AC TGC GAG ATGAGGGAGGC C TC AGA 2063 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1163 CAGGGCCTCAGGGGAGTCTCTGCTCCTCAAGCCCTGCTGGGAGTAAAGGGAGGCCTCAGG 1222 

Qy 2064 GGAC C C AGC AC CC T AGG A CACCGCACCCCTGTCTGAGACTGAG — GCTGCC 2112 

I I I I I II II I I I I Ml I I I I I I I I I I I I I I I I I I I II II 

Db 1223 GAACCCAGGTCCTCAGGATAGGGGGTCCACTCCAACCCTGTCTGAGACTGAGGCGCCTCC 1282 

Qy 2113 AC T TC TGGCC T CAAGAATC AGAACGATGGGGAC TCAGATT GCATGGGGGTGGGACCCAGG 2172 

III I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1283 TC T T T C AT CC T CGGGAAT C AC AGGGAT GGAGAC TC AC GTC AGC AGAGGGT GGGGC CC AAC 1342 

Qy 2173 CC TGCAAGGC T TACGCGGAGGAAGAGGAGGGAGGAC TCAGGGGACC TTGGAATCCAGATC 2232 

I I I I I III I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I 
Db 1343 CC TGCCAGGAT CAAGGAGAGGAAGAAGAGGGAGGAC TCAGGGTACC T T TGAGTCCAGAAC 1402 

Qy 2233 AGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATGGCCCATATTTCC 2292 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I III 
Db 1403 AATGGGGACCTTTGCCCTGGGAGGTCCAGTGCACAGTGGCCACCTGTAGCCCATGCTTGC 1462 

Qy 2293 TGC AT C T T T GAGG TGAC AGGACAGAGCTGTGGTCTGAGAAGTGGGGCCTCAGGTCA 2348 

I I I I III I I I I I I I I I I II I I I I I I I I I III I I I I I I I I I I I I I I I 

Db 1463 TGC AC C T T C T GGGT GAC AAAGAGGAGAG GGC T GTGG TC AGAGC AGT GG T GAC T C AGGT C A 1522 

Qy 2349 AC AGAGG GAGG AGT T C C AGGAT CC AT AT GGC C C AAGAT GT GC C C CC T T CAT GAGGAC T GG 2408 

I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I II III 
Db 1523 GC AGAGGGAGG AGT C C C AGC AT C T GC AGGC C C C AAT GT G T GC C C CAT T CAT GAAGAT T GG 1582 

Qy 2409 GGAT AT C C C C G GC T C AGAAAGAAGGGAC T C CAC AC AGT C T GGC TGTCCCCTTT TAGT AGC 24 68 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1583 GGAT A- C C T TGGC T C AGAAAGAAGGGAC C C C AC AGAGTC T GGC TGTCCCCT GAT T T T T GC 1641 

Qy 2469 TCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCACAGGCAGG 2528 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1642 TCAGAGGGGACCAAATCAAGGATAGCCC TATGTGCCAACC TCAT TTGTGCCACAGGAAAG 1701 

Qy 2529 AAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCTACTCATGT 2588 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I 
Db 1702 AAG T T GAAGAGC C C TC AGGGTGAT GGGGT C T T GC AG T AAAGGGGAGC TAT C T GC TCAT C T 17 61 

Qy 2589 CAGGGAATTGG GGGT TGAGGAAGC AC AGGC GCT GGC AGGAATAAAGATGAGTGAGAC AGA 2648 

I I I I I II I I I I I I I I I I II I I I I I I I I II II II 
Db 1762 CAGGGGGTTTCAGGTTGAGGAATGGCAGGCCCCATCACGATGAAGAGTAACCCACAGG-- 1819 

Qy 264 9 CAAGGCTATTGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACACCTCA 2703 

II II I II I I I I I I I I I I I I I I I II I I I I I I I I I II I I II I II 
Db 1820 AGC C AT AGAAAC AC TC AC CCC AGAAC C AAAGGGGT CAT AC C T GGAC AC C C C ATG T GG 187 6 

Qy 2704 CCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACC 2759 

I I I I I I I I II II I III I I I I I I I I I I I I I I I III I I I I I I I I I I 
Db 1877 GGGTGACAGGATGTAGC-TCCATCTCATTCCTGTTTTCAGATCTCGGGGAGGTGAGGAAC 1935 

Qy 27 60 TCAT T C T C AGAGGG TGAC T C AGGT C AAC GT AGGGAC C C C C ATC T GGTC T AAAGACAGAGC 2819 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1936 TTGTTCTCC GAGGAT GAC T C AGGT C AAC AC AG GGGC CC C C ATC T GGT GGAT AGAC AGAGT 1995 
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Qy 2820 GGTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCA 2879 

I I t I I I I II I I I I I II I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1996 GGTCC C AGGAT C TGT C AG T AGT TC C GGT GAGGAAC ATGAGGGAC GAT T GAGGGC AC C CT T 2055 

Qy 2880 GGAC C AGAAC AC T GAGGGAGAC TG C AC AGAAATC AGCC C T GC C C C TGC TGT C AC CC CAGA 2939 

II I I I I I I I I I II I III III I II I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 2056 GGGC C AGAAC AC AGATGAGGAC C T C AC G GAAAT CTGCCCTGCCCCTGC TGT C AC TC CAGA 2115 

Qy 2940 GAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCC — GTTATCCTGGGATCATTGATGTCA 2997 

I I I M I I I I I I I I I I I I I II I I II I II III I I I I I I I I I I I I I I I I I I 

Db 2116 GAGCATGGGCAGGGCTGTCTGCTGCAGTCCCCCCCACTTACCCTGGGATCATTGGTGTCA 2175 

Qy 2998 GGGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAG 3057 

I I I I I I I I I I I III III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 217 6 GGGATGGGGAGGTCTTTGTC-GAGGGGTCTGCACTCAGGTCAGTAGAGGGAGCGTCTTAG 22 34 

Qy 3058 GC C C T GC C AGGAGTC AAGG TGAGG AC C AAGC G GGC ACC T C AC C C AGGAC AC AT TAAT TCC 3117 

I I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I II I I I I I I I I I I I I I 
Db 2235 GC C C TGC C AGGAGAC AAGG TAAGAAC GAAGC AGGT T CC T C AC C C AGGAC AC AT GAAT TCC 2294 

Qy 3118 AAT GAAT T T TGAT AT CTCTTGCTGCCCTTCCC C A- AGGAC C TAGGC AC GT GT GGC C AGAT 317 6 

I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2295 AATGCATTTCAGCATCTCTTCCTGTCCTTCCCAAGAGGACCTGGGCACGTGTGGCCAGAT 2354 

Qy 3177 GTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTC 3236 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2355 GTGAGTCTCCTCATGTCCT GT TCC CTATCAGGGATGTGAGCTCT TAAT CTGAGTTTC 2411 

Qy 3237 TCAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTG 32 96 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I III 
Db 2412 TCAGGCCAGCAAAAGGGTGGGATCCAGGCCTTGCCAGGAGAAAGGTGAGGGCCCTGTGTG 2471 

Qy 3297 AGAAC AG AGGGGGT CAT C C AC TGC AT GAGAGT GGGGAT GT C AC AGAGT CC AGC C C AC C C T 3356 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2472 AGC ACAGAGGGGACC AT TCACCCC AAGAGGGT GGAGACC T CACAGAT T CCAGCC TACC C T 2531 

Qy 3357 CCTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGAT 3416 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 2532 CCTGTTAGCACTGGGGGCCTGAGGCTGTGCTTGCAGTCTGCACCCTGAGGGCCCATGCAT 2591 

Qy 3417 TCCTCTTCC T GGAGC TCC AGGAAC C AGGC AG T GAGG C C T T GGTC TGAGAC AGT AT C C TC A 3476 

I I I I I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2592 TCCTCTTC C AGGAGC T C C AGGAAAC AGAC AC T GAGG C C T T GGTC TGAGGC C GT GC C C T C A 2651 

Qy 3477 GGTCACAGAGCAGAGGATGCACAGGGT GTGCCAGCAGTGAATGTTTGCCCTGAATG 3532 

I I I I I I I I I I I I I I I I I . Ill I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2652 GGT C AC AGAGC AGAGGAGATGC AGAC G T C TAG T GC C AGCAGTGAACGT T T GC C T T GAAT G 2711 

Qy 3533 C AC AC C AAGGGC C C C AC C T GC C AC AGGAC AC AT AGGAC T C C AC AGAGT C T GGC C T C A- C C 35 91 

I I I I I II I I I I I I III III III II I I I II I I I II I I I I I I I I I II 

Db 2712 C AC AC TAAT GGC C C C CAT C GC C C C AGAAC AT AT GGGAC T C C AGAGC AC C T GGC C TC AC C C 2771 

Qy 3592 TCC CTACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTG TACC CTGAGTACCCTC 3651 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2772 TCTCTACTGTCAGTCCTGCAGAATCAGCCTCTGCTTGCTTGTGTACCCTGAGGTGCCCTC 2831 

Qy 3652 TCACT TCC TCC TTC AGGT TTTCAGGGGACAGGCCAACCCAGAGGAC A 3698 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II II I 
Db 2832 TCACTTTTTCCTTCAGGTTCTCAGGGGACAGGCTGACCAGGATCACCAGGAAGCTCCAGA 2891 

Qy 3699 GGAT T C C C TGGAGGC C AC AGAGGAGC AC C - AAGGAGAAGAT C T GTAAG TAGGC C T T T GT T 3757 
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1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 

Db 2892 GGATC C C C AGG AGGC C C TAGAGGAGC AC C AAAGGAGAAGATC T G T AAG TAAGC C T T T G T T 2951 

Qy 3758 AGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGC 3817 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2952 AGAGCCTCCAAGGTTCAGTTTTTAGCTGAGGCTTCTCACATGCTCCCTCTCTCTCCAGGC 3011 

Qy 3818 CTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTC 3877 

I I M I I I I I I I I I I II I II I I I I I I M I I I M I I II I I I I I III I I I I I I I I I I 
Db 3012 CAGTGGGTCTCCATTGCCCAGCTCCTGCCCACACTCCTGCCTGTTGCGGTGACCAGAGTC 3071 

Qy 3878 AT C ATGT C T C T TGAGC AGAGGAGT C TGC AC TGC AAGC C TGAGGAAGC C C T TG AGGC C C AA 3937 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 3072 GT C AT GT C TC T TGAGCAGAAGAGT C AGC AC TGCAAGC C TGAGGAAGGC C T TGAC AC C C AA 3131 

Qy 3938 CAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC C 397 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3132 GAAGAGGC C C T GGGC C T GG TGGGT G TGC AGGC T GCC AC TAC TGAGGAGC AGG AGGC T G T G 3191 

Qy 3977 TCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACA 4036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3192 TCCTCCTCCTCTCCTCTGGTCCCAGGCACCCTGGGGGAGGTGCCTGCTGCTGGGTCACCA 3251 

Qy 4037 GAT C C TC C C C AGAGT C C T C AGGGAGCC T CCGCCTTTCC C AC TAC C ATC AAC T T C AC TC GA 4096 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3252 GGTCCTCTCAAGAGTCCTCAGGGAGCCTCCGCCATCCCCACTGCCATCGATTTCACTCTA 3311 

Qy 4097 C AG AGGC AAC C C AGT GAGG GT T C C AGC AGC C G T GAAGAGGAGGGGC C AAGC AC C T C T T GT 4156 

I I I I I I I III I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3312 TGGAGGCAATC CAT TAAGGGCTCC AGCAAC CAAGAAGAGGAGGGGCCAAGCAC C TCCCC T 3371 

Qy 4157 ATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTT 4216 

II I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I III II I I I I 

Db 3372 GAC C C AGAG TC TGTGTTCC GAGC AGC AC TC AG T AAGAAGG T GGC TGAC T T GAT TC AT T T T 34 31 

Qy 4217 C T GC T CC T C AAAT AT CGAGC CAGG GAGC C AGT C AC AAAGGC AGAAATG C TGG AGAGT GT C 4276 

I I I I I I I I I I I Ml II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 34 32 CTGCTCC TCAAGTAT TAAGTCAAGGAGC TGGTC AC AAAGGC AGAAATGCTGGAGAGCGTC 34 91 

Qy 4277 ATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAG 4 336 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 34 92 ATCAAAAATTACAAGCGCTGCTTTCCTGAGATCTTCGGCAAAGCCTCCGAGTCCTTGCAG 3551 

Qy 4337 CTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTC 4396 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I 
Db 3552 C T GGTC T T TGGCAT T GAC GT GAAGGAAG C GGAC C C CACC AGCAAC AC C TAC AC C C T TGT C 3611 

Qy 4397 ACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTG AT AAT C AGAT CAT GC C C AAG 4 4 53 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3612 ACCTGCCTGGG — ACTCCTATGATGGCCTGCTGGTTGATAATAATCAGATCATGCCCAAG 3669 

Qy 44 54 ACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAG 4 513 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 3670 ACGGGCCTCCTGATAATCGTCTTGGGCATGATTGCAATGGAGGGCAAATGCGTCCCTGAG 3729 

Qy 4514 GAGGAAATC TGGGAGGAGC TGAGTGTGATGGAGGTGTATGATGGGAGGGAGC ACAGTGCC 4 57 3 

III II I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3730 GAGAAAATC TGGGAGGAGC TGAGTGTGATGAAGGTGTATGTTGGGAGGGAGC ACAGTGTC 3789 

Qy 4574 TATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA- 4632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 3790 TGTGGGGAGCCCAGGAAGC TGCTCACCCAAGATTTGGTGC AGGAAAAC TACC TGGAGTAC 3849 

Qy 4 633 CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTC 4 692 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 3850 CGGCAGGTGCCCAGCAGTGATCCCATATGCTATGAGTTACTGTGGGGTCCAAGGGCACTC 3909 

Qy 4 693 GCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGC 4752 

I I I I I I I I I I I II III I III III I I I I I I I I I I I I I I I I I 

Db 3910 GCTGCT TGAAAGTACTGGAGCACGTGGTCAGGGTCAATGCAAGAGTTCTC 3959 

Qy 4753 T T T T TC T TC C C AT C C C T GC GTGAAGC AGC T T TGAGAGAGGAGGAAGAG GGAG TC TGAGC A 4812 

III II I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3960 AT T TC C T AC C C AT C C C TGC GT GAAGC AGC T T T GAGAGAGG AGGAAGAGGGAG TC TGAGCA 4019 

Qy 4813 TGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGT 4 872 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 4020 TGAGCTGCAGCCAGGGCCACTGCGAGGGGGGCTGGGCCAGTGCACCTTCCAGGGCTCCGT 407 9 

Qy 4873 CCAGCAGCTTCCCCTGCC-TCGTGTGACATGAGGCCCATTCTTCACTC— TGAAGAGAGC 4929 

I I I I II MINIUM I I I I I I I I I I | | | | | M I I I I I I III I I I I I I I I I I 
Db 4080 C C AG TAG TTTCCCCT GC C T TAATG TGAC AT GAGGC C CAT TCTTCTCTCTTT GAAGAGAGC 4139 

Qy 4 930 GGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGT 4 98 9 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I MINI I I I I I I I I I I I I I I 
Db 4140 AGTCAACATTCTTAGTAGTGGGTTTCTGTTCTATTGGATGACTTTGAGATTTGTCTTTGT 4199 

Qy 4990 TCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATC 5049 

I I I I I I I I I I I I I I I I I I I I I III I I I I I I II II I I I I I I I I I I I I I I I I I I I 
Db 4200 TTCCTTTTGGAATTGTTCAAATG-TTTCTTTTAATGGGTGGTTGAATGAACTTCAGCATT 4258 

Qy 5050 CAAGTTTATGAATGACAGCAGTCACAC — AGTTC TGTGTATATAGT TTAAGGGTAAGAGT 5107 

Ml I I I I I I I I I II I I I I I I I I I I I III I I I I I M I I I I I I II I I I II I I I I 
Db 4259 CAAATTTATGAATGACAGT AGTCACACATAGT GC TGT TTATATAGTT T AGGAGTAAGAGT 4 318 

Qy 5108 CTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGG — ATAATAACAG 5165 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II III I I I I I 

Db 4319 CTTGTTTTT TAT T C AGAT T GGGAAAT C C AT T C CAT T T T GT GAAT T GGGAC AT AGT T AC AG 4378 

Qy 5166 CAGTGGAATAAGTACTTA-GAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAAAGAA 5224 

II I I I I I II I I I I I I I I II I I I I I I I I II II I I I I I I 

Db 4 37 9 CAGTGGAATAAGTATTCATTTAGAAATGTGAATGAGCAGTAAAACTGATGACA 44 31 

Qy 5225 C TAAAGAAAT T AAGAGAT AGT C AAT TC T TGC C T TAT AC C T C AGT C TAT T C TG TAAAAT T T 5284 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I II Ml 

Db 4432 - TAAAGAAAT TAAAAGATATTTAATTCTTGCTTATACTCAGTCTATTCGGTAAAATTTTT 44 90 

Qy 5285 T TAAAGAT AT AT GC AT AC C T GGAT T T C C T TGGC T TC T T T GAGAAT GT AAGAGAAAT T AAA 5344 

II I I I M I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I 
Db 44 91 TTTAAAAAATGTGCATACCTGGATTTCCTTGGCTTCTTTGAGAATGTAAGACAAATTAAA 4550 

Qy 5345 TCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTG 5404 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I M I I I I I 

Db 4551 TCTGAATAAATCATTCTCCCTGTTCACTGGCTCATTTATTCTCTATGCACTGAGCATTTG 4610 

Qy 5405 C T T T T TGGAAGGCC C T GGG T T AGT AGTGGAGAT GC T AAGG T AAGC C AGAC T CAT AC C C AC 5464 

II I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 4611 CTCTGTGGAAGGCCCTGGGTTAATAGTGGAGATGCTAAGGTAAGCCAGACTCACCCCTAC 4670 

Qy 54 65 CCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCT 5524 

III I I I I I III I I I II I I I I I I I I I 1 I I I I I I I II I I I I I II I I I I I I I 

Db 4 671 CCACAGGGTAGTAAAGTCTAGGAGCAGCAGTCATATAATTAAGGTGGAGAGATGCCCTCT 4730 
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Qy 

Db 


5525 AA 5526 
I I 

4731 AA 4732 


RESULT 11 
AAQ32351 

ID AAQ32351 standard; DNA; 2419 BP. 
XX 

AC AAQ32351; 
XX 

DT 25-MAR-2003 (revised) 

DT 22-APR-1993 (first entry) 

XX 

DE Antigen E gene. 
XX 

KW Stable; antigen; E; D; F; A; human; melanoma; cell line; MZ2-MEL; 

KW cytolytic T cell; MEL3.1; open reading frame; homology; MAGE; 

KW melanoma antigen; ss . 
XX 

OS Homo sapiens . 
XX 

PN WO9220356-A1. 
XX 


PD 

26 

-NOV- 

1992. 



XX 






PF 

22 

-MAY- 

1992; 

92WO- 

US004354 

XX 






PR 

23 

-MAY- 

1991; 

91US- 

00705702 

PR 

09 

- JUL- 

1991; 

91US- 

00728838 

PR 

23 

-SEP- 

1991; 

91US- 

00764364 

PR 

12 

-DEC- 

1991; 

91US- 

00807043 


XX 

PA (LUDW-) LUDWIG INST CANCER RES. 
XX 

PI Boon T, Van Der Bruggen P, Van Den Eynde B, Van Pel A, De Plaen E; 

PI Lurquin C, Chomez P, Traversari C; 

XX 

DR WPI; 1992-415460/50. 
XX 

PT Nucleic acid mol . encoding a human tumour rejection antigen precursor - 

PT useful as an immunostimulant in a vaccine for treating and preventing 

PT cancers, also useful in diagnosis. 
XX 

PS Disclosure; Page 69-70; 142pp; English. 
XX 

CC This sequence encodes the stable antigen E. This antigen is expressed 

CC along with antigens "D, F and A" by the human melanoma cell line M22- 

CC MEL. These antigens are all recognised by cytolytic T cells. A subline of 

CC MZ2-MEL is MEL3 . 1 which only expresses antigen E. This cell line was 

CC chosen as a source for the isolation of this sequence. This sequence was 

CC found to contain three exons . The open reading frame for antigen E was 

CC contained within the first two exons. An ATG is located at position 66 of 

CC exon 3 and is followed by an 828 base pair reading frame. The three exons 

CC contain 65, 73 and 1551 base pairs. During the isolation of this sequence 

CC two different but closely reated cDNAs were also identified. These cDNAs, 

CC when tested, did not transfer expression of antigen E, but they did show 

CC substantial homology to the antigen E cDNA sequence. These new cDNAs 

CC represent a new family of genes refered to as melanoma antigens (MAGE) 

CC (see also AAQ32352-69) . (Updated on 25-MAR-2003 to correct PN field.) 
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XX 

SQ Sequence 2419 BP; 562 A; 581 C; 677 G; 599 T; 0 U; 0 Other; 


Query Match 42.6%; Score 2419; DB 2; Length 2419; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 3256 GGATC C AGGC C C T GC C AGGAAAAATATAAGGGCCC T GC GT GAGAAC AGAGGGGGT C AT C C 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGAT C C AGGC CCTGCCAGGAAAAAT AT AAGGGCCCTGCGT GAGAAC AG AGGGGGTC AT CC 60 

Qy 3316 AC T GC AT GAGAGTGGGGAT GTC AC AGAG TC C AGC C C AC C C T C C T GGT AGC AC T GAGAAGC 3375 

f I I I I I I I I I I I I I t I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AC T GC AT GAGAGTGGGGAT GT C AC AGAG TC CAGC CC AC C C T C C T GGTAGC AC TGAGAAGC 120 

Qy 337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAAC C AGGC AG T GAGGC C TTGG T C TGAGAC AGT AT C C T C AGGT C AC AGAGC AGAGGAT G 3495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 181 GGAAC CAGGCAGTGAGGCC TTGGTC TGAGACAGTATCC TCAGGTCACAGAGCAGAGGATG 240 

Qy 3496 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I II I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 CAGGACACATAGGAC TCCACAGAGTCTGGCC TCACC TCCC TACT GTC AGTCC TGTAGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 301 CAGGACACATAGGAC TCCACAGAGTCTGGCC TCACC TCCC TACT GTCAGTCC TGTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 367 6 GGGACAGGCCAACCC AGAGGACAGGAT T CCC TGGAGGCCACAGAGGAGCACC AAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 421 GGGACAGGCCAACCC AGAGGACAGGAT T CCC TGGAGGCCACAGAGGAGCACC AAGGAGAA 480 

Qy 3736 GAT C T GT AAGT AGGC C T T T GT TAGAGTC TC CAAGGT T C AG T T C T CAGC T GAGGC C T C TC A 3795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 37 96 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GC C T GC T GC C C TGAC GAGAGTC AT CAT G TC T C T T GAGC AGAGGAGT C T GC AC T GC AAGC C 3915 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GC C T GC T GC C C TGAC GAGAGTC AT CAT G TC T C T T GAGC AGAGGAGT C T GC AC T GC AAGCC 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I [ I I I I I II I I I 
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Db 781 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 840 

Qy 4096 AC AGAGGC AAC CC AG T GAGGGT T C C AGC AGC C GTGAAGAGGAGGGGCC AAGC AC C T C T T G 4155 

I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 ACAGAGGCAAC CCAGTGAGGGTTCCAGC AGCC GTGAAGAGGAGGGGCCAAGC ACCT C T TG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCT C AAAT ATC GAGC C AG GGAGCC AG TC AC AAAGGC AGAAAT GC TGGAGAGT GT 42 75 

I I I I I I I M I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I t I I I I I I I I I I I I I i I I 
Db 961 TCTGCTCCT C AAAT ATC GAGC C AGGGAG CC AG TC AC AAAGGC AGAAAT GC TGGAGAG T GT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 1021 CAT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC C T C TGAG TC C T TGC A 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I II I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 C AC C T GC C T AGGTCT C TC C TAT GATGGC C T GC T GGG T GAT AATC AGAT C ATGC C CAAGAC 4455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 C AC C T GCC T AGGTCT C T C C TAT GATGGC C T GC T GGGTGAT AATC AGAT C ATGC C CAAGAC 1200 

Qy 44 56 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 12 60 

Qy 4516 GGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTA 4575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 GGAAAT C T GGGAGGAGC TGAGT GT GAT GGAGG TGT AT GAT GGGAGGGAGC AC AGTGC C T A 1320 

Qy 4 57 6 T GGGGAGC C C AGGAAGC TGC TC AC CC AAGAT T TGGT GC AGGAAAAG T AC C TGGAGT AC GG 4635 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 T GGGGAGC C C AGGAAGC TGC TC AC CC AAGAT T TGGT GC AGGAAAAGT AC C TGGAGT AC GG 1380 

Qy 4636 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 4695 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 1440 

Qy 4696 GAAACCAGCTATGTGAAAGTCCT TGAGT ATGTGATCAAGGTCAGTGCAAGAGTTCGCTTT 4 755 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTT 1500 

Qy 4756 T T C T T C C CATC C C TGCGTGAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGT C T GAGC AT GA 4815 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 1 I I II I I I 
Db 1501 T TC T TC C CAT C C C T GC GTGAAGC AGC T T TGAGAGAGGAGGAAGAGGGAG T C T GAGC AT GA 1560 

Qy 4816 GTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCA 4875 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCC AGTGC ACCTTCCAGGGCCGCGTCCA 1620 

Qy 487 6 GC AGC TTCCCCTGCC TC GT GT GAC AT GAGGC C CAT T C T T C AC T C TGAAGAGAGC GG TC AG 4 935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCAG 1680 

Qy 4936 TGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTT 4 995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTT 1740 
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Qy 4996 TTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTT 5055 

E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1741 T T GGAAT TGT T CAAATGT T f T T TT T T AAGGGATGGT T GAAT GAAC T TC AGC AT CCAAGT T 1800 

Qy 5056 TATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTT 5115 

I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TATGAAT GAC AGC AG TCAC ACAGT T C T G T GTAT AT AGTT T AAGGGTAAGAG TCTTGTGTT 1860 

Qy 5116 T TAT T C AGAT T GGGAAATC C AT TC TAT T T TGT GAAT TGGGATAATAAC AGC AGT GGAAT A 5175 

I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 T TAT T C AGAT T GGGAAATC CAT TC TAT T T TG T GAAT TGGGATAATAAC AGC AGTGGAAT A 1920 

Qy 5176 AGT AC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAAAGAACTAAAGAAAT T 5235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AGTAC T TAGAAATGT GAAAAATGAGCAGTAAAATAGATGAGATAAAGAACTAAAGAAAT T 1980 

Qy 5236 AAGAGAT AG T C AAT TCTTGCCT T ATAC C TC AG TC T AT TC T G T AAAAT T T T TAAAGAT ATA 5295 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 AAGAGAT AGTC AAT TCTTGCCT TAT AC C T C AG TC TAT TC T GTAAAAT T T T TAAAGAT AT A 2040 

Qy 5296 T GC AT AC C TGGAT T T CC T T GGC TT C T T T GAGAATGT AAGAGAAAT T AAATC T GAAT AAAG 5355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 T GC AT AC C T GGAT T T C C T T GGC T T C T T T GAGAATGT AAGAGAAAT T AAATC T GAAT AAAG 2100 

Qy 5356 AATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAG 5415 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 AATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAG 2160 

Qy 5416 GC C C T GGG T T AGT AG TGGAGAT GC T AAGGT AAGC C AGAC T C ATAC C C AC C C AT AGG G TC G 5475 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 GCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTCG 2220 

Qy 54 7 6 TAGAGT C T AGGAGC T GCAG TC AC G TAAT C GAGGT GGC AAGAT GT C C TC T AAAGATG TAGG 5535 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I II I I I I I I I I I I I I 

Db 2221 TAGAGT C TAGG AGC T GCAG T C AC G TAAT C GAG GT GGC AAGAT GT C C TC TAAAGAT G TAGG 2280 

Qy 5536 GAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 5595 

I I I I I I I I I I I I I I I It I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IE I 
Db 2281 GAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 2340 

Qy 5596 CCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGT 5655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGT 2400 

Qy 5656 AAT GAT CTTGGGT GGAT CC 5674 

I I I I I I I I I I I I I I I I I I I 
Db 2401 AATGATCTTGGGTGGATCC 2419 
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DE Tumour rejection antigen E encoding DNA. 
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KW Tumour rejection antigen E; melanoma antigen-3; MAGE- 3; cancer; 

KW cytolytic T cells; antigen D; human leucocyte antigen; ss . 
XX 

OS Homo sapiens . 
XX 

PN WO9423031-A1 . 
XX 

PD 13-OCT-1994. 
XX 

PF 17-MAR-1994; 94WO-US002877 . 
XX 

PR 26-MAR-1993; 93US-00037230 . 
XX 

PA (LUDW-) LUDWIG INST CANCER RES. 
XX 

PI Gaugler B, Van Den Eynde B, Boon-Falleur T, Van Der Bruggen P; 
XX 

DR WPI; 1994-333192/41. 
XX 

PT New tumour rejection antigen precursor MAGE 3 - useful in treatment and 

PT diagnosis of cancer. 

XX 

PS Disclosure; Page 58; 105pp; English. 
XX 

CC AAQ72476 encodes tumour rejection antigen E, another sequence AAQ72470 

CC encodes melanoma antigen-3 (MAGE-3) a tumour rejection antigen precursor. 

CC Melanomas characterised by the expression of MAGE-3 can be detected, or 

CC monitored, by contacting a test sample with an agent that can recognise 

CC MAGE-3. The melanoma can be treated by the administration of cytolytic T 

CC cells specific for the complex of antigen D (the mature rejection antigen 

CC derived from MAGE-3) and a human leucocyte antigen (esp. HLA-A1) . 

CC (Updated on 25-MAR-2003 to correct PN field.) 
XX 

SQ Sequence 2419 BP; 562 A; 581 C; 677 G; 599 T; 0 U; 0 Other; 

Query Match 42.6%; Score 2419; DB 2; Length 2419; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 3256 GGATC C AGGCC C TGC CAGGAAAAATATAAGGGCCC TGCGT GAGAACAGAGGGGGTC ATCC 3315 

i I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I E I I I I I I I I I I I I I 
Db 1 GGATCCAGGCCCTGC CAGGAAAAATATAAGGGCCC TGCGT GAGAACAGAGGGGGTC ATCC 60 

Qy 3316 AC T GC AT GAGAGTGGGGAT GT C AC AGAG T C C AGC C C ACC C TC C T GGT AGC AC TGAG AAGC 3375 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AC T GC AT GAGAGT GG GGAT GT C AC AGAG T CC AGC C C AC C C TC C T GGT AGC AC TGAGAAGC 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 34 36 GGAAC C AGGC AGT GAGGC C T T GGT C TGAGAC AGT AT C C TC AGGT C AC AGAGC AGAGGATG 34 95 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 181 GGAAC C AGGC AGT GAGGC C T T GG T C T GAG AC AG TAT C CT CAGGTC AC AGAGC AGAGGAT G 240 

Qy 34 96 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I l -l I I I I I I I I I I I I I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AGGAC AC ATAGGAC T C C AC AGAGT C T GGC C T C ACC TCC C T AC T GTC AGTCC T GTAGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 301 CAGGACACATAGGAC TCCACAGAGTCTGGCCTCACC TCCC TACTGTCAGTCC TGTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCACAGAGGAGCACCAAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCACAGAGGAGCACCAAGGAGAA 480 

Qy 37 36 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 37 95 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I 

Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 37 96 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GC C TGC T GC C C TGAC GAGAGT C AT CAT G T C T C T TGAGC AGAGGAGT C T GC AC T GC AAGC C 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 GC C TGC T GCC C T GAC GAGAGTC AT CAT G T C T C T T GAGC AG AGGAGT C T GC AC T GC AAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 840 

Qy 4096 AC AGAGGC AAC C C AG T GAG GGT T C C AGC AGC C GT GAAGAGGAGGGGCC AAGC AC C T C T T G 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

*Db 841 AC AGAGGC AAC C C AG T GAG GGT TC C AGC AGC C GT GAAGAGGAGGGGC C AAGC AC C T C T TG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1021 CAT C AAAAAT T AC AAGCAC T GT TT TC C T GAGAT C T T C GGC AAAGC C TC T GAGT CC T TGCA 1080 

Qy 4336 GC T GGT C T T TGGC AT T GAC GT GAAGGAAGC AGAC C C C AC C GGC C AC TC C TAT GTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 GC T GGT C T T TGGCAT TGAC GT GAAGGAAGC AG AC C C C AC C GGC C AC T C C TAT GT CC T T GT 1140 

Qy 4 396 C AC C TGC C T AGGT C T C TC C T ATGATGGC C T GC T GGG TGAT AAT C AGAT C AT GC C C AAGAC 4455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 C AC C TGC CTAGGTCTCTCC TAT GAT GGC C TGC TGGGTGATAATC AGAT CATGCCC AAGAC 1200 

Qy 4456 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 AGGCTTCC TGAT AAT TGTCCTGGTCATGAT TGC AATGGAGGGCGGCCATGCTCCTGAGGA 1260 
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Qy 4 516 GGAAATC TGGGAGGAGC TGAGTGTGATGGAGGTGTATGATGGGAGGGAGC AC AGTGCC TA 4 575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I 
Db 1261 GGAAATC TGGGAGGAGC TGAGTGT GATGGAGGTGTATGATGGGAGGGAGCAC AGTGCC TA 1320 

Qy 4576 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACGG 4635 

I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I II I II I I I I I I I I I I M I I I I I I I I I I 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACGG 1380 

Qy 4636 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 4695 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I 
Db 1381 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 1440 

Qy 4 696 GAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTT 4755 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 41 GAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTT 1500 

Qy 4756 T TC T TC C CAT C CC TGC GT GAAGC AGC T T T GAGAGAGGAGGAAGAGGGAG TC T GAGC AT GA 4815 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 T TC T TCC C ATC CC TGCGTGAAGCAGC T T TGAGAGAGGAGGAAGAGGGAGTC T GAGC ATGA 1560 

Qy 4816 GTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCA 4875 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IE I I I I I I I I I I I 
Db 1561 GTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCA 1620 

Qy 4876 GCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCAG 4935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GC AGC TTCCCCTGCCTCGT GT GAC AT GAGGC C CAT T C T TC AC TC T GAAGAGAGC GG TC AG 1680 

Qy 4 936 TGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTT 4 995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTT 1740 

Qy 4 996 TTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTT 5055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTT 1800 

Qy 5056 TAT GAAT GACAGC AGT CAC AC AGT T C T G TGT ATAT AGT T T AAGGGT AAGAG TCTTGTGTT 5115 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TAT GAAT GACAGC AG TCAC AC AGT T C TG TGT ATAT AGT T T AAGGGT AAGAG TCTTGTGTT 1860 

Qy 5116 T TATTCAGAT T GGGAAATC CATTC TAT T TTGT GAAT TGGGATAATAAC AGCAGTGGAATA 517 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T TAT TCAGAT T GGGAAATC CATTC TAT T TTGT GAAT TGGGATAATAAC AGCAGTGGAATA 1920 

Qy 5176 AGT AC T T AGAAAT G T GAAAAATGAGC AG TAAAAT AGATGAGATAAAGAAC TAAAGAAAT T 5235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AGT AC T T AGAAATG T GAAAAATGAGC AG TAAAAT AGATGAGATAAAGAAC TAAAGAAAT T 1980 

Qy 5236 AAG AGAT AGTC AAT TCTTGCCT TAT AC C TC AG TC T AT TC T GTAAAAT T T TTAAAGAT AT A 5295 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 AAG AGAT AGTC AAT TCTTGCCT TAT AC C TC AG TC TAT T C T G TAAAAT T T TTAAAGAT AT A 2040 

Qy 5296 T GC AT AC C TGGAT T T CC T T GGC T T C T T T GAGAAT GT AAGAGAAAT T AAATC T GAAT AAAG 5355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 TGC AT AC C TGGAT T T CC T T GGC T T C T T T GAGAAT GT AAGAGAAAT T AAATC T GAAT AAAG 2100 

Qy 5356 AATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAG 5415 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAG 2160 
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Qy 5416 GC C C T GGG T T AGT AG TGGAGAT GC TAAGGTAAGC C AGAC T CAT AC C C AC C C ATAGGG TC G 5475 

I I I I I I I I I I I I I I I f I I I I I I I I I I I I I I I I I I I I E I I I I 1 I I I I I I I I I I I I I I I I I I 
Db 2161 GC C C T GGGT TAGT AG T GGAGAT GC TAAGGTAAGC C AGAC T CAT AC CC AC C C ATAGGGTC G 2220 

Qy 5476 TAG AGT C TAGG AGC T GC AG TC ACG T AAT CGAG GTGGC AAGATGT C C T C TAAAGATG T AGG 5535 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 TAGAGTC TAGGAGCT GCAGTCACGTAATCGAGGTGGCAAGATGT CC TC TAAAGATGTAGG 2280 

Qy 5536 GAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 5595 

I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 2340 

Qy 5596 CCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGT 5655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I M I I 
Db 2341 CCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGT 2400 

Qy 5656 AATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I 
Db 2401 AATGATCTTGGGTGGATCC 2419 


AAX84112; 

08-SEP-1999 (first entry) 
Antigen E coding sequence. 

Tumour rejection antigen; vaccine; cancer; antigen E; ss. 
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(LUDW-) LUDWIG INST CANCER RES. 

Van Der Bruggen P, Traversari C, Lurquin C, Boon T, De Plaen E; 
Van Pel A, Chomez P, Van Den Eynde B; 

WPI; 1999-418294/35. 

New tumour rejection antigen is useful as a vaccine against cancerous 
diseases . 

Disclosure; Col 37-40; 58pp; English. 

This sequence represents the antigen E coding sequence. The invention 
relates to a tumour rejection antigen sequence that is useful as a tumour 
rejection antigen for vaccination against cancerous conditions 
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XX 

SQ Sequence 2419 BP; 562 A; 581 C; 677 G; 599 T; 0 U; 0 Other; 


Query Match 42.6%; Score 2419; DB 2; Length 2419; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 3256 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I 
Db 1 GGATC C AGGC C C T GC C AGG AAAAATAT AAGGGC CC T GC GT GAGAAC AG AGGGGGT C ATC C 60 

Qy 3316 AC TGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCC TCCTGGTAGCAC TGAGAAGC 3375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AC T GC AT GAGAGT GGGGAT GTC AC AGAG TC C AGCC C AC C C T C C T GGTAGC AC T GAGAAGC 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I i I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAAC C AGGC AG T GAGGC C T TGGT C TGAGAC AGT AT C C TC AGGT C AC AGAGC AGAGGAT G 3495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAAC C AGGC AGT GAGGC C T TGGT C TGAGAC AG TAT C C TC AGGT C AC AGAGC AGAGGAT G 240 

Qy 3496 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 CAGGAC AC AT AGGAC T C C AC AGAG TC T GGCC T C AC C T C C C T AC T GT C AGTC C T GT AGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CAGGAC AC AT AGGAC T C C AC AGAG TC T GGC C T C AC C T C C C TAC T GT C AGTC C T GT AGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I li I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGGAC AGGC C AAC C C AGAGGAC AGGAT T C C C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 421 GGGAC AGGC C AAC C C AGAGGACAGGAT T CC C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 480 

Qy 37 36 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 37 95 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GAT C TGT AAG T AGGC C T T T GT TAG AGT C T C C AAGGT T C AG T T C T C AGC TGAGGC C TC T C A 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GC C TGC T GC C C TGAC GAGAGT CAT C ATG T C TC T TGAGC AGAGGAG T C T GC AC T GC AAGC C 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GCC TGC TGCCC TGAC GAGAGTC AT CAT GTC TC T TGAGC AG AGGAGTC TGC AC TGC AAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 397 6 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 781 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 840 

Qy 4096 ACAGAGGC AAC CC AG T GAGGGT TC C AGC AGC C GTGAAGAGGAGGGGCC AAGC AC C T C T TG 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AC AGAGGC AAC CC AG TGAGGGT TC C AGC AGC C G TGAAGAGGAGGGGCC AAGC AC C T C T TG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCT C AAAT AT C GAGCC AGGGAGC C AG T C AC AAAGGC AG AAAT GC TGGAGAGTGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1021 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I II I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 4455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 1200 

Qy 4 4 56 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 1260 

Qy 4516 GGAAAT C TGGG AGGAGC T GAGT GT GATGGAGG T GT AT GAT GGGAGGGAGC AC AGT G C C T A 4575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GGAAAT C T GGG AGGAGC T GAGT GT GAT GGAGG T GT AT GAT GGGAGGGAGC AC AGT G C C T A 1320 

Qy 4576 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACGG 4635 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACGG 1380 

Qy 4 636 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 4 695 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 1440 

Qy 4 696 GAAACC AGC TAT GTGAAAG T C C T T GAGT AT GT GAT C AAGG TC AG T GC AAGAGT T C G C T T T 4 755 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 41 GAAACC AGC TAT GTGAAAG T C C T T GAGT AT GT GAT C AAGG T C AG T GC AAGAGT T C G C T T T 1500 

Qy 4756 T T C T TC C CAT CCCTGCGT GAAGC AGC T T T GAG AGAGGAGGAAGAGGGAGT C T GAGC AT GA 4815 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1501 T T C T TC C CAT C C C TGC GTGAAGC AGC T T T GAG AGAGGAGGAAGAGGGAGT C T GAGC ATGA 1560 

Qy 4816 GTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCA 4875 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCA 1620 

Qy 4876 GC AGCT T CCCCTGCCTCGT GTGAC ATGAGGCC C AT T C T TC AC TC T GAAGAGAGC GG T C AG 4935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GCAGCTT CCCCTGCCTCGT GTGAC ATGAGGCC CAT TCTTCACTCTGAAGAGAGCGGTC AG 1680 

Qy 4 936 TGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTT 4 995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1681 TGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTT 1740 
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Qy 4 996 TTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTT 5055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTT 1800 

Qy 5056 TATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTT 5115 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 TATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTT 1860 

Qy 5116 T T AT TC AGAT T GGGAAATC CAT TC TAT T T T GT GAAT TGGGAT AATAAC AGC AGTGGAATA 5175 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I 

Db 18 61 T T AT T C AG AT T GGGAAAT C C AT TC TAT TTTGT GAAT TGGGAT AATAAC AGC AGTGGAATA 1920 

Qy 517 6 AGT AC T T AGAAATGTGAAAAATGAGC AGT AAAATAGATGAGAT AAAGAAC T AAAGAAAT T 5235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AGT AC T T AGAAAT GTGAAAAAT GAGC AG T AAAAT AGAT GAGAT AAAGAAC TAAAGAAATT 1980 

Qy 5236 AAGAGAT AGT C AAT TC T T GC C T T ATAC C TC AG TC T ATT C T G TAAAAT T T T T AAAGAT AT A 5295 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 AAGAGAT AGT C AAT TCTTGCCT TAT AC C T C AG TC TAT TC T GT AAAAT T T T T AAAGAT AT A 2040 

Qy 5296 T GC ATAC C T GGAT T TC C T T GGC T T C T T T GAGAATGT AAGAGAAAT TAAATC T GAAT AAAG 5355 

I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 T GC AT AC C TGGAT T TC C T T GGC T T C T T T GAGAATG T AAGAGAAAT T AAAT C T GAAT AAAG 2100 

Qy 5356 AATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAG 5415 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAG 2160 

Qy 5416 GC C C TGGGT T AGTAGT GGAGAT GC TAAGG T AAGCC AGAC T C ATAC C C AC C C ATAGGGT C G 5475 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTCG 2220 

Qy 54 7 6 T AGAGTC T AGGAGC TGC AG T C ACG T AAT C GAGGTGG C AAGATG T CC TC TAAAGATG TAGG 5535 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 TAG AGT C TAGG AGC T GC AG T C AC G T AAT C G AGG T GGC AAG AT GT C C T C T AAAGAT G TAGG 2280 

Qy 5536 GAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 5595 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GAAAAG T GAGAGAGGGGT GAGGGT GT GGGGC T C CGG GT GAGAGT GG T GGAG T GTC AATGC 2340 

Qy 5596 CCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGT 5655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGT 2400 

Qy 5656 AATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I 
Db 2401 AATGATCTTGGGTGGATCC 2419 


RESULT 14 
AAT05086 

ID AAT05086 standard; DNA; 2419 BP. 
XX 

AC AAT05086; 
XX 

DT 25-MAR-2003 (revised) 

DT 26-FEB-1996 (first entry) 

XX 

DE MZ2-MEL antigen E precursor gene. 
XX 
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f\W 

Mo 1 a noma ♦ M7 9 

-MEL; tumour rejection antigen; cancer; diagnosis; ss. 

YY 



UD 

nomo Sapiens . 


YY 
AA 



DM 



YY 
AA 



on 

nft-CPD_1 QQC; 
UO tD.Ejir .LyyO . 


YY 
AA 



DTT 


y jwu-ubuu^^ uj. 

YY 
AA 



nn 
irK 

m _ M7\ D _ 1 QCM • 

q/ittc nnon/noi 
y fl Uo-UU^: /z / . 

DD 

10-MAR-1994; 

94US-00209172. 

DI? 
rK 

01-SEP-1994; 

94US-00299849. 

PR 

30-NOV-1994; 

94US-00346774. 

YY 
AA 



Pfl 

IT.M. 

(LUDW-) LUDWIG INST CANCER RES. 

v V 
AA 



DT 

De Plaen E, 

Boon-Falleur T, Lethe B, Szikora J, De Smet C; 

DT 

Chomez P, Gaugler B, Van Den Eynde B, Brasseur F, Patard J; 

DT 

Weynants P, 

Marchand M, Van Der Bruggen P; 

YY 
AA 



UK 

WPI; 1995-320586/41. 

YY 



r 1 

Determn. of cancerous condition (s) - using a nucleic acid as a primer to 

PT 

determine expression of a MAGE tumour rejection antigen precursor. 

YY 
AA 



DC 

Example 20; Page 69-70; 121pp; English. 

V Y 

AA 



CC 

A gene sequence (AAT05086) hybridizes with a 2.4 kb fragment from human 

cc 

melanoma cell 

line MZ2-MEL but not with E- antigen loss variants of MZ2- 


MEL. This E precursor antigen gene sequence was obtd. from a cosmid 

CC 

derived from 

DNA of the E+ subclone MZ2-MEL 43. (Updated on 25-MAR-2003 

cc 

to correct PI 

field. ) 

XX 



SQ 

Sequence 2419 

BP; 560 A; 581 C; 677 G; 601 T; 0 U; 0 Other; 


Query Match 42.6%; Score 2415.8; DB 2; Length 2419; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2417; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 


Qy 

3256 

GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 

3315 



1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

1 

GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 

60 

Qy 

3316 

AC T GC AT GAGAGT GGGGAT GT C AC AGAG TC CAGC C C AC C C TC C T GGT AGC AC TGAG AAGC 

3375 



1 1 1 1 1 II 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 


Db 

61 

AC T GC AT GAGAGTGGGGAT GT C AC AGAG TC CAGC C C AC CC TC C T GGT AGCAC TGAG AAGC 

120 

Qy 

3376 

CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 

3435 



1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

121 

CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 

180 

Qy 

3436 

GGAACCAGGCAGTGAGGCC TTGGTC TGAGACAGTATCCTC AGGTCACAGAGC AGAGGATG 

3495 



1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

181 

GGAACCAGGC AGTGAGGCC T TGGT C TGAGAC AG TAT CC TC AGGTCACAGAGC AGAGGATG 

240 

Qy 

3496 

CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 

3555 



1 1 1 1 1 1 E 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 

241 

CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 

300 

Qy 

3556 

C AGGAC AC AT AGGAC TC C AC AGAG T C TGGC C T C AC C T C C C TAC T GTC AGTC C TGT AGAAT 

3615 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 301 C AGGAC AC AT AGGAC TC C AC AGAG TCTGGCCTCACCTCCC TAG T G TC AG T CC TGTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGGACAGGC CAACCC AGAGGACAGGAT T CCC T GGAGGCCACAGAGGAGCACC AAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GGGACAGGC CAACCC AGAGGACAGGAT TCCC T GGAGGCCACAGAGGAGCACC AAGGAGAA 4 80 

Qy 3736 GAT C T GT AAGT AGGC C T T T GT TAG AG T C TC CAAGGT T C AG T T C T C AGC TGAGGC C T C T C A 3795 

I I I I M I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I | I | | | | | | | | | 
Db 481 GATCTGT AAGT AGGC CTTTGTTAGAGTCTCCAAGGTTCAGTTCTC AGC TGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GC C T GC T GC C C T GAC GAGAGTC AT CAT G TC TC T T GAGC AGAGGAGT C T GC AC T GC AAGC C 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 601 GC C T GC T GC C C T GAC GAGAGT C AT C ATG TC TC T T GAGC AGAGGAGT C T GC AC T GC AAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | 
Db 781 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 840 

Qy 409 6 AC AGAGGC AAC C C AG T GAGGGT TC C AGC AGC C GT GAAGAGGAGGGGC C AAGC AC C T C T T G 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AC AGAGG C AAC C C AG T GAGGGT TC C AGC AGC C GT GAAGAGGAGGGGC C AAGC AC C T C T TG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCT C AAATAT C GAGC C AGGGAG C C AG TC AC AAAG GC AGAAAT GC T GGAGAGT GT 4275 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TC T GC T C C T C AAATAT C GAGC C AGGGAG C CAGTC AC AAAGGC AGAAAT GC T GGAGAGTG T 1020 

Qy 4276 CAT C AAAAAT T AC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC C T C TGAG T CC T T GC A 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CATCATTAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 114 0 

Qy 4396 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 4455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 1200 

Qy 4 4 56 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4 515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 12 60 

Qy 4516 GGAAAT C TGGGAGGAGC T GAG T GT GAT GGAGG TGTATGAT GGGAGGGAGC AC AG TGC C TA 4575 

I I I I I I I I M I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTA 1320 

Qy 4576 TGGGGAGC C C AGGAAGC T GC T C AC C C AAGAT T T GG T GC AG GAAAAGT ACC TG GAGT AC GG 4635 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACGG 1380 

Qy 4 636 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 4695 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGGTGCCGGACAGTGATCCCGCACGC TAT GAGT TCCTGTGGGGTCCAAGGGCCCTCGCT 1440 

Qy 4 696 GAAAC C AGC TAT G T GAAAG T C C T T GAGT ATGT GAT C AAGG TC AG T GC AAGAG TTCGCTTT 4 755 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 G AAACC AGC TATGTGAAAGTCCTTGAGT ATGT GATC AAGG TCAGTGCAAGAGTTCGCTTT 1500 

Qy 4756 T TC T T C C C ATC C C TGC GT GAAGC AGC T T T GAG AGAGGAGGAAGAGGGAGT C TGAGC AT GA 4815 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 T TC TTCC CATC CCTGCGTGAAGCAGCTT TGAGAGAGGAGGAAGAGGGAGTC TGAGC ATGA 1560 

Qy 4816 GTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCA 4875 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCA 1620 

Qy 4876 GCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCAG 4935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GC AGC TTCCCCTGCC T CG T GTGAC ATGAGGC C CAT T C T TC AC T C TGAAGAGAGC GG TC AG 1680 

Qy 4936 TGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTT 4995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTT 1740 

Qy 4 996 TTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTT 5055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTT 1800 

Qy 5056 TATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTT 5115 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTT 18 60 

Qy 5116 TTAT TCAGAT T GGGAAATC CAT TC TATT TTGTGAAT TGGGATAATAAC AGC AGTGGAATA 5175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T TAT T C AGAT T GGGAAAT C CAT TC TAT T T T GTGAAT T GGG ATAAT AAC AGC AG TGGAATA 1920 

Qy 5176 AGTAC TT AGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAAAGAAC TAAAGAAAT T 5235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AGTAC T T AGAAATGT GAAAAATGAGC AG TAAAAT AG ATGAGAT AAAGAAC TAAAGAAAT T 1980 

Qy 5236 AAGAGATAGTCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATATA 5295 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I 
Db 1981 AAGAGATAGTCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATATA 2040 

Qy 5296 T GC AT AC C T GGATT T CC T T GGC T T C T T T GAGAATGT AAGAGAAAT T AAAT C T GAAT AAAG 5355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2041 T GC AT AC C T GG AT T T C C T T GGC T T C T T T GAGAATG T AAGAGAAAT T AAAT C T GAAT AAAG 2100 

Qy 5356 AATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAG 5415 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAG 2160 
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Qy 5416 GCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTCG 5475 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I 
Db 2161 GCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTCG 2220 

Qy 547 6 T AGAGTC T AGG AGC T GC AG T C ACG TAAT CGAGGTGGC AAG AT GT C C T C T AAAGATG TAGG 5535 

I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I 
Db 2221 T AGAGTC TAGG AGC T GC AG T C ACGTAAT C GAGG TGGC AAG AT GT C C TC T AAAGAT G TAGG 2280 

Qy 5536 GAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 5595 

I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II M 
Db 2281 GAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 2340 

Qy 5596 CCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGT 5655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGT 2400 

Qy 5656 AATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I 
Db 2401 AATGATCTTGGGTGGATCC 2419 


RESULT 15 

AAQ72472 

ID 

AAQ72472 standard; DNA; 2420 BP. 

XX 


AC 

AAQ72472; 

XX 


DT 

25-MAR-2003 (revised) 

DT 

21-JUN-1995 (first entry) 

XX 


DE 

Tumour rejection antigen E precursor gene DNA. 

XX 


KW 

Tumour antigen rejection precursor E; melanoma antigen-3; MAGE-3; cancer; 

KW 

cytolytic T cells; antigen D; human leucocyte antigen; ss . 

XX 


OS 

Homo sapiens . 

XX 


PN 

WO9423031-A1. 

XX 


PD 

13-OCT-1994 . 

XX 


PF 

17-MAR-1994; 94WO-US002 877 . 

XX 


PR 

26-MAR-1993; 93US-00037230 . 

XX 


PA 

(LUDW-) LUDWIG INST CANCER RES. 

XX 


PI 

Gaugler B, Van Den Eynde B, Boon-Falleur T, Van Der Bruggen P; 

XX 


DR 

WPI; 1994-333192/41. 

XX 


PT 

New tumour rejection antigen precursor MAGE 3 - useful in treatment and 

PT 

diagnosis of cancer. 

XX 


PS 

Example 20; Page 28; 105pp; English. 

XX 


CC 

AAQ72472 is the tumour rejection antigen E precursor gene, another gene 

CC 

AAQ72470 encodes melanoma antigen-3 (MAGE-3) also a tumour rejection 

CC 

antigen precursor. Melanomas characterised by the expression of MAGE-3 

CC 

can be detected, or monitored, by contacting a test sample with an agent 
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CC that can recognise MAGE- 3 . The melanoma can be treated by the 

CC administration of cytolytic T cells specific for the complex of antigen D 

CC (the mature rejection antigen derived from MAGE- 3 ) and a human leucocyte 

CC antigen (esp. HLA-A1) . (Updated on 25-MAR-2003 to correct PN field.) 

XX 

SQ Sequence 2420 BP; 562 A; 582 C; 677 G; 599 T; 0 U; 0 Other; 

Query Match 42.4%; Score 2408; DB 2; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 3256 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 60 

Qy 3316 AC T GC AT GAGAGTGGGGAT GT C AC AGAG TC C AGC C C AC C C TCC T GGTAGC AC TGAGAAGC 3375 

I I I I I I I I I I I ! ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 61 AC T GC AT GAGAGTGGGGAT GT C AC AGAG TC C AGC C C ACC C TC C T GGTAGC AC TGAGAAGC 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAAC C AGGC AGT GAGGC C T T GGT C T GAGAC AGT AT C C T C AGGT C AC AGAGC AGAGGATG 3495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAAC C AGGC AGT GAGGC C T TGGT C T GAGAC AG TAT C C T C AGGT C AC AGAGC AGAGGATG 240 

Qy 34 96 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AGGAC AC AT AGGAC TC C AC AGAG T C T G GC C T C AC C TC C C TAC TGT C AGTC C TG T AGAAT 3615 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C AG GAC AC AT AGGAC TC C AC AGAG T C T G GC C T C AC C TC C C TAC TGT C AGTC C TGT AGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCACAGAGGAGCACCAAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCACAGAGGAGCACCAAGGAGAA 480 

Qy 3736 GAT C TGT AAGT AGGC C T T T GT T AGAG T C TC C AAGGT TC AG TT C TC AGC T GAGGC C T C T C A 3795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 481 GAT C TGT AAGT AGGC CT T T GT TAG AGTC TCC AAGGT TC AGT TCTC AGC TGAGGCCTCTC A 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCC 3915 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 601 GCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCC 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCC T C C CC AGAG T CC T C AGGGAGC C TC C GC C TT TCC C AC T AC CAT C AAC T TC AC TC G 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 781 AGATC C T CC C C AGAG TCC T C AGGGAGC C TC C GC C TT TCCC AC TAC CAT C AAC T TC AC T CG 840 

Qy 4096 AC AGAGGC AAC C C AG TGAGGGT TC C AGC AGC C G T GAAGAGGAGGGGC C AAGC AC C T C T TG 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AC AGAGGC AAC C C AG TGAGGGT TC C AGC AGC C GTGAAGAG GAGGGGC C AAGC AC C T C T TG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TC T GC TC C TC AAAT ATCGAGCC AGGGAGCC AGTC AC AAAGGC AGAAAT GC TGGAGAGTGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TC T GC TC C TCAAATATCGAGCCAGGGAGCCAGTCAC AAAGGCAGAAAT GC TGGAGAGTGT 1020 

Qy 4276 CAT C AAAAAT T ACAAGC AC TGTTTTCCT GAGAT C TT C GGC AAAGC C T C T GAG TC C T T GC A 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1021 CAT C AAAAAT T ACAAGC AC TGTTTTCCT GAGAT C TT C GGC AAAGC C T C TGAG TC C T T GC A 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GC T GGTC T T TGGC AT T GAC GT GAAGGAAGC AGAC CC C AC C GGC C AC TCC TAT GTCCTTGT 1140 

Qy 4396 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 4455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 C AC C TGC C T AGGT C T C TC C TAT GAT GGC C TGC T GGG T GAT AATC AGAT C ATG C C C AAGAC 1200 

Qy 4456 AGGC T TC C T GATAAT T GT C C T GGT CAT GAT T GC AAT GGAGGGC GGC CAT GC TCC TGAGGA 4515 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGGC T TC C T GATAAT T GT C C T GGT CAT GAT T GC AAT GGAGGGC GGC CAT GC T C C TGAGGA 1260 

Qy 4516 GGAAATC T GGGAGGAGC T GAGT GT GAT GGAGGT GTAT GAT GGGAGGGAGC AC AGTGC C T A 4575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GGAAATC T GGGAGGAGC T GAGT GT GAT GGAGGT GTAT GAT GGGAGGGAGC AC AGTGC C T A 1320 

Qy 4 57 6 TGGGGAGC CC AGGAAGC T GC T C AC C C AAGAT T T GGT GC AGGAAAAGT AC C T GGAGT A- C G 4 634 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1321 TGGGGAG C C C AGGAAGC T GC T C AC C C AAGAT T T GGT GC AGGAAAAGT AC C TGGAGT AC C G 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I 

Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4 695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 41 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 1500 

Qy 4755 TTTCTTCC C ATCC C T GCGT GAAGC AGC T T T GAGAGAGGAG GAAGAGGGAGT C T GAGC AT G 4814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 TTTCTTCC CAT C C CT GCGT GAAGC AGC T T TGAGAGAGGAG GAAGAGGGAGT C T GAGC ATG 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGC AGC TTCCCCTGCCTCG TGT GAC ATGAGGC C CAT T C T T C AC T C TGAAGAG AGC GGT C A 4 934 

I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1621 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 1680 
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Qy 

Db 


4935 
1681 


GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 
I I I I I I t I I I I I I I I II I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I 1 I I I I I I I I I I I 
GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 


4994 
1740 


Qy 4995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I 
Db 1741 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 18 60 

Qy 5115 T T TAT T C AGAT TGGGAAATC C AT T C TAT TT T G TGAAT TGGGATAATAAC AGC AGT GGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 T T T AT T C AGAT TGGGAAAT C CAT T C TAT TT T G TGAAT TGGGATAATAAC AGC AGT GGAAT 1920 

Qy 5175 AAG T AC T TAGAAAT G TGAAAAATGAGC AGTAAAAT AGATGAGAT AAAGAAC T AAAGAAAT 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAG TAC T TAGAAAT G TGAAAAATGAGC AGTAAAAT AGATGAGAT AAAGAAC T AAAGAAAT 1980 

Qy 5235 T AAGAGATAGT C AAT TC T T GC C T TAT AC C T CAGT C T AT TC T GTAAAAT T T T T AAAGAT AT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 T AAGAGATAGT C AAT TC T T GC C T TAT AC C T C AGT C TAT TC T GTAAAAT T T T T AAAGAT AT 2040 

Qy 52 95 AT G CAT AC C T GGAT T TC C T T GGC T T C T T TGAGAAT GTAAGAGAAAT TAAAT C TGAATAAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 AT GC AT AC C T GGAT TTCCTTGGCTTCTT TGAGAAT GTAAGAGAAAT TAAAT C T GAATAAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GTAGAGT C TAGGAGC TGCAGTCAC GTAATCGAGGTGGC AAGATGTCC T C TAAAGAT GTAG 5534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GTAGAGT C TAGGAGC T GC AGTC AC GTAATC GAGGT GGC AAGATG T C C T C TAAAGAT GTAG 2280 

Qy 5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2281 GGAAAAG T GAGAGAG GGGT GAGGG TGT G GGGC T C C GGGT GAGAG T GGT GGAG TG T C AAT G 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I 
Db 2401 TAATGATCTTGGGTGGATCC 242 0 
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Run on: 


August 25, 2006, 12:01:51 ; Search time 6169 Seconds 

(without alignments) 
11301.677 Million cell updates/sec 


Title: 

Perfect score: 
Sequence : 


US-08-819-669E-8 
5674 

1 CCCGGGGCACCACTGGCATC T AATGAT C T T GGGT GGAT C C 5 67 4 


Scoring table: I DENT I T Y_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 18892170 seqs, 6143817638 residues 


Total number of hits satisfying chosen parameters: 37784340 


Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 


Database : Published_Applications_NA_Main: * 

1 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/US07_PUBCOMB. seq: * 

2 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/US08_PUBCOMB. seq: * 

3 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/US09A_PUBCOMB. seq: * 

4 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/US09B_PUBCOMB. seq: * 

5: /EMC_Celerra_SIDS3/ptodata/2/pubpna/US09C_PUBCOMB. seq:* 

6: /EMC_Celerra_SIDS3/ptodata/2/pubpna/US10A_PUBCOMB. seq:* 

7 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/US10B_PUBCOMB. seq:* 

8 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/US10C_PUBCOMB. seq:* 

9: /EMC_Celerra_SIDS3/ptodata/2/pubpna/US10D_PUBCOMB. seq:* 

10 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/US10E_PUBCOMB . seq: * 

11: /EMC_Celerra_SIDS3/ptodata/2/pubpna/US10F_PUBCOMB.seq: * 

12 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/US10G_PUBCOMB. seq: * 

13 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/USllA_PUBCOMB . seq : * 

14 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/USllB_PUBCOMB . seq: * 

15 : /EMC_Celerra_SIDS3/ptodata/2/pubpna/USllC_PUBCOMB.seq: * 

16: /EMC_Celerra_SIDS3/ptodata/2/pubpna/USllD_PUBCOMB. seq: * 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 


SUMMARIES 

% 

Result Query 


io . 

Score 

Match 

Length 

DB 

ID 

Description 

1 

5567 . 8 
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10 

US -10- 7 56-14 9-3550 

Sequence 3550, Ap 
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2 513.6 

44 

.3 

A O fl C 

4 8 95 

c 
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US- 10-102- 524-1696 

Sequence 1696, Ap 

3 

2 513 . 6 
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.3 

4 8 95 
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US- 10-482-029-14 7 

Sequence 147, App 
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9 

US-10-482-029-87 

Sequence 87, Appl 
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2 420 

7 
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Sequence 81, Appl 
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2408 

42 

.4 

2 420 

9 

US-10-741-466-5 

Sequence 5, Appli 
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2408 

42 
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2420 

9 
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Sequence 81, Appl 
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2408 

42 

.4 

2420 

9 
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Sequence 17, Appl 
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2408 

42 
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2420 

9 

US-10-866-484-5 

Sequence 5, Appli 

10 

2408 

42 

.4 

2420 

9 

US-10-482-029-91 

Sequence 91, Appl 

11 

2408 
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.4 

2420 

10 

US -10-871-708-14 

Sequence 14, Appl 

12 

2408 

42 

.4 

2420 

13 
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Sequence 81, Appl 

13 

2408 
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.4 

2420 
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US -11-0 67 -159-81 

Sequence 81, Appl 

14 

2408 

42 

.4 

2420 

16 
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Sequence 25, Appl 
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42 

.4 

2420 

6 

US-10-093-766-41 

Sequence 41, Appl 

16 

2404 . 8 

42 

.4 

2420 
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.1 

2408 
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Sequence 111713, 

18 

2390 . 4 

42 

.1 

2408 

6 

US- 10-02 7 -632 -1117 14 

Sequence 111714, 

19 

2390 . 4 

42 

.1 

2408 

7 

US- 10-02 7 -632 -1117 13 

Sequence 111713, 

20 

2390 . 4 

42 

.1 

2408 

7 

US-10-02 7-632-111714 

Sequence 111714, 

21 

2307 . 6 

40 

.7 

302250 

3 

US- 09-9 62 -8 32 -154 

Sequence 154, App 

22 

2307 . 6 

40 

.7 

302250 

10 

US - 10- 8 4 3- 64 1A- 60 4 0 

Sequence 6040, Ap 

23 

2306 

40 

.6 

302250 

3 

US- 09-9 62 -8 32 -154 

Sequence 154, App 

2 4 

2306 

40 

.6 

302250 

.10 

US- 10-8 4 3- 64 1A- 6040 

Sequence 6040, Ap 

2 5 

2117 . 8 

37 

.3 

4 559 

7 

US -10-117-937-82 

Sequence 82, Appl 

2 6 

2117.8 

37 

.3 

4 559 

9 

US -10- 657-022-82 

Sequence 82, Appl 

27 

2 117 . 8 

37 

.3 

4 559 

13 

US -11-0 67 -064-82 

Sequence 82, Appl 

28 
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37 

.3 
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13 

US -11-0 67 -159-82 

Sequence 82, Appl 

2 9 
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34 

.3 
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8 
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US-10-444-683-43 

Sequence 43, Appl 

30 

1765.8 

31 
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4204 
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US-10-116-802-229 

Sequence 22 9, App 

3 1 

1762 . 6 

31 

.1 

4 204 

3 

US -09-954-456-747 

Sequence 74 7, App 

32 

1762 . 6 

31 

.1 

4204 

3 

US-09-784-199-1 

Sequence 1, Appli 
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34 

1762.6 

31 

.1 
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3 

US-09-849-602-14 

Sequence 14, Appl 

35 

1762.6 

31 

.1 

4204 

7 
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Sequence 1, Appli 

36 

1762. 6 

31 

.1 

4204 

7 

US-10-117-937-83 

Sequence 83, Appl 

37 

1762. 6 

31 

.1 

4204 

8 

US-10-444-683-1 

Sequence 1, Appli 

38 

1762. 6 

31 

.1 

4204 

9 

US-10-657-022-83 

Sequence 83, Appl 

39 

1762. 6 

31 

.1 

4204 

9 

US-10-482-029-89 

Sequence 89, Appl 

40 

1762. 6 

31 

.1 

4204 

10 

US-10-843-641A-3774 

Sequence 3774, Ap 

41 

1762.6 

31 

.1 

4204 

10 

US-10-871-708-15 

Sequence 15, Appl 

42 

1762. 6 

31 

.1 

4204 

13 

US-11-067-064-83 

Sequence 83, Appl 

43 

1762. 6 

31 

.1 

4204 

13 

US-11-067-159-83 

Sequence 83, Appl 

44 

1762.6 

31 

.1 

4204 

16 

US-11-155-288-26 

Sequence 26, Appl 

45 

1677 

29 

.6 

3871 

9 

US-10-482-029-93 

Sequence 93, Appl 
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US-10-756-149-3550/C 

Sequence 3550, Application US/10756149 
Publication No. US20050181375A1 
GENERAL INFORMATION: 
APPLICANT: Aziz, Natasha 
APPLICANT: Zlotnik, Albert 

TITLE OF INVENTION: NOVEL METHODS OF DIAGNOSIS OF METASTATIC CANCER, COMPOSITIONS A 
TITLE OF INVENTION: METHODS OF SCREENING FOR MODULATORS OF METASTATIC CANCER 
FILE REFERENCE: file 

CURRENT APPLICATION NUMBER: US/10/756,149 
CURRENT FILING DATE: 2004-01-12 
NUMBER OF SEQ ID NOS : 5818 
SOFTWARE: Patentln version 3.2 
SEQ ID NO 3550 
LENGTH: 259903 
TYPE: DNA 

ORGANISM: Homo Sapiens 
US-10-756-149-3550 

Query Match 98.1%; Score 5567.8; DB 10; Length 259903; 

Best Local Similarity 99.6%; Pred. No. 0; 

Matches 5655; Conservative 0; Mismatches 17; Indels 7; Gaps 7; 

Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I j I I I I 
Db 112112 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 112053 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 112052 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 111993 

Qy 121 C T C TC AAC C C AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC T GAC T T GAGC AT TAG T GG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 111992 C T C TC AAC C C AGGGAAGC C C AGGT GC C C AGAT GTGAC GC C AC TGAC T T GAGC AT TAG T GG 111933 

Qy 181 T T AGAGAGAAGCGAGGT T T TC GGT C T GAGGGGC GGC T TGAGAT C GG T GGAGGGAAGC GGG 240 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 111932 T T AGAGAGAAG CGAGGT T T TC GGT C T GAGGGGC GGC T TGAGAT C GGT GGAGGGAAGC GGG 111873 

Qy 241 CC C A- GC T C T GTAAGGAGGC AAGGTGAC AT GC T GAGGGAGGAC TGAGGAC C C AC T T AC C C 299 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 111872 CCC AGGC T C T GTAAGGAGGC AAGG TGAC ATGC TGAGGGAG GAC T GAGGAC C C AC T T AC C C 111813 

Qy 300 CAGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTT 359 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 111812 CAGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTT 111753 

Qy 360 CTCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGA 419 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 111752 CTCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCTGAAGTCAG 111693 

Qy 420 GCTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACA 479 

I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 111692 AGCTCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACA 111633 

Qy 480 T CAT GC T C AGG AT T C T C AAGG AGGGC TG AGGG T C C C T AAG AC C C C AC T C C C G T GAC C C AA 539 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I 
Db 111632 T C ATGC T C AGGAT T C T C AAGGAGGGC TGAGGG TCC C T AAG AC C C CAC T C C C G T GAC C C AA 111573 

Qy 540 CCCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCC 599 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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1 1 


Db 111572 CCCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCC 111513 

Qy 600 ACCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCC 659 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 111512 ACCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCC 111453 

Qy 660 TCACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCC 719 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db ' 111452 TCACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCC 111393 

Qy 720 GCCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAG 77 9 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I i I 
Db 111392 GCCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAG 111333 

Qy 780 AGAAGC G AGGT T TC C AT TC T GAGG GAC GGC GT AGAG T T C GGC C GAAGGAAC C TGAC C C AG 839 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 111332 AGAAGC G AGGT T TC C AT TC TGAGGGAC GGC GT AGAG T T C GGC CGAAGGAAC C T GAC C C AG 111273 

Qy 840 GCTCTGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCACTCCAAAT 8 99 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 111272 GCTCTGTGAGGAGGCAAGGTGAGAGGCTGAGGGAGGACTGAGGACCCCGCCACTCCAAAT 111213 

Qy 900 AGAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAG 959 

I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 111212 AGAGAGCCCCAAATATTCCAGCGCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAG 111153 

Qy 960 ACGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTT 1019 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 111152 ACGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTT 111093 

Qy 1020 CTTCTCCCCAAGCTCTGGAATCAGAGGTTGCTGTGACCAGGGCAGGACTGGTTAGGAGAG 1079 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 111092 C T TC TC C CC AAGC TC TGGAATC AGAGGT TGC T GTGACC AGGGC AGGAC TGGT T AGGAGAG 111033 

Qy 1080 GGCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCC 1139 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 111032 GGC AGGGC AC AGGC T C TGC CAGGC ATC AAGAT C AGC ACCC AAGAGGGAGGGC TGTGGGCC 110973 

Qy 1140 CCCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAAC 1199 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 110972 CCCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAAC 110913 

Qy 1200 CCCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCAC 1259 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 110912 CCCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCAC 110853 

Qy 1260 CACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAA 1319 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 110852 CACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAA 110793 

Qy 1320 CCCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATC 1379 

I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 110792 CCCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATC 110733 

Qy 1380 CGGTT TGC CCC TGC TCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCAC TGAC 1439 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 110732 CGGTT TGCCCC TGC TCTCAACCCAGGGAAGCCCTGGATGGCCCGATGTGAAACC AC TGAC 110673 

Qy 1440 T T G AAC C T C AC AGAT C TGAGAGAAGC C AGGT T CAT T T AAT GG T T C TGAGGGGC GGC T T GA 1499 

I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 110672 TTGAACCTC AC AGATC TGAGAGAAGC CAGGTT CAT TTAATGGTTCTGAGGGGCGGCTTGA 110613 
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Qy 1500 GAT C C AC TGAGGGGAGTGG T T T T AGGC T CTGT GAGGAGGC AAGG TGAG AT GC T GAG GGAG 1559 

I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 110612 GAT C C AC TGAGGGGAGTGG T T T TAGGC T C TGT GAGGAGGC AAGG TGAG AT GC TGAG GGAG 110553 

Qy 1560 GAC T GAG GAGG C AC AC AC C CC AGGT AGATGGCC C C AAAAT GAT C C AGT AC C AC CC C TGC T 1619 

I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 110552 GAC T GAGGAGGC AC AC AC C CC AGG TAGATGGC C C C AAAAT GAT C C AGT AC C AC CC C TGC T 1104 93 

Qy 1620 GC C AGC C C T GG AC C AC C C GGC C AGGAC AGATGTC TC AGC T GGAC C AC CCCCCGTCCCGTC 167 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 110492 GCCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTC 110433 

Qy 1680 CCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGT 1739 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 110432 CCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGT 110373 

Qy 1740 TGGTCAGGAGA-GGCAGGGCCCAGGCATCAAGGTCCA-GCATCCGCCCGGCATTAGGGTC 17 97 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 110372 TGGTCAGGAGAGGGCAGGGCCCAGGCATCAAGGTCCAGGCATCCGCCCGGCATTAGGGTC 110313 

Qy 1798 AGGAC C C T GGG AGGGAAC T GAGGG T TC C CC AC C C AC ACC T GTC T C C T C AT C T C C AC C GC C 1857 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I 
Db 110312 AGGACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATCTCCACCGCC 110253 

Qy 1858 ACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTG 1917 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 110252 ACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTG 110193 

Qy 1918 CTGT C AAC C C AC GGAAGC C ACGGGAAT GGC GGC C AGGC AC TC GGAT C T TGAC GT C C C CAT 1977 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 110192 CTGT C AAC C C AC GGAAGC C AC GGGAAT GGCGGC C AG GCAC TC GGATC T TGAC GT C C C CAT 110133 

Qy 1978 CCAGGGTC TGATGGAGGGAAGGGGC TTGAACAGGGC C TCAGGGGAGCAGAGGGAGGGCCC 2037 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 110132 CCAGGG-C TGAT GGAGGGAAGGGGC TTGAACAGGGC C TCAGGGGAGCAGAGGGAGGGCCC 110074 

Qy 2038 T AC T GC G AGAT GAGGGAGGC C TC AGAGGAC C C AGC AC CC T AGGAC AC C GCAC CCCTGTCT 2097 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 
Db 110073 T AC T GC GAGAT GAGGGAGGC C TC AGAGGAC C C AGC AC CC T AGGAC AC C GCAC CCCTGTCT 110014 

Qy 2098 GAG AC T G AGGC T GC C AC T T C TGGC C TC AAGAAT C AG AAC GATGGGGAC T C AGAT T - GC AT 2156 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 110013 GAG AC T GAGGC T GC C AC TTCTGGCCT CAAGAAT C AGAAT GATGGGGAC T C AGAT TAGC AT 109954 

Qy 2157 GGGGGTG GGAC C C AGGC C T GC AAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC TC AG GGGA 2216 

I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109953 GGGGGTGGGAC CC AGGC C TGCAAGGCTT AC GC GGAGGAAGAGGAGGGAGGAC TC AGGGGA 1098 94 

Qy 2217 C C T T GGAAT C C AGAT C AGT GT GGAC CT C GGC CC T GAGAGG TC C AGGGC AC GG TGGC C AC A 227 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109893 C C T T GGAAT C C AGAT C AGT GTGGAC C TC GGC C C TGAGAGG TC C AGGGC AC GG T GGC C AC A 109834 

Qy 2277 TATGGCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGG 2336 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109833 TATGGCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGG 109774 

Qy 2337 GGCCTCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTT 2396 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109773 GGCCTCAGGTCAACAGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTT 109714 
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Qy 2397 CAT GAGGAC T GGGGATATC CC C GGC TC AGAAAGAAGGGAC TC C AC AC AGTC T GGC T GT C C 2456 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 109713 CAT GAGGAC TGGGGATAT C CC CGGC TC AGAAAGAAGGGAC T C C AC AC AG TC T GGC T GTCC 109654 

Qy 2457 CCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGT 2516 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 109653 CCTTTTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGT 109594 

Qy 2517 ACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGAT 2576 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109593 ACCACAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGAT 109534 

Qy 2577 GTC TACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGC TGGC AGGAATAAAGAT 2636 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109533 GTC TAC TCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGC TGGC AGGAATAAAGAT 1094 74 

Qy 2637 GAG TGAGAC AGAC AAGGC TAT TGGAAT C C AC AC C CC AGAACC AAAGGGG T C AGC CC T GGA 2696 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109473 GAG TGAGAC AGAC AAGGC T AT TGGAATC C T C AC C CC AGAAC C AAAGGGGT C AGC C C T GGA 109414 

Qy 2 697 CACCTCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGG 2756 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109413 CACCTCACCCAGGATGTGGCTTC-TTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGG 109355 

Qy 2757 ACC TCAT TC TC AGAGGGTGAC TCAGGTC AACGTAGGGACC CCCATC TGGTC TAAAGACAG 2816 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109354 ACC TCAT TCTCAGAGGGTGACTCAGGTCAACGTAGGGACC CCCATC TGGTC TAAAGACAG 109295 

Qy 2817 AGC GGT C C C AGGATC T GC C ATGCG T TC GGGT GAGGAAC AT GAGGGAGGAC T GAGGG TAC C 2876 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109294 AGC GGT C C C AGGAT C T GC C ATGCG T TC GGGT GAGGAAC AT GAGG GAGGAC T GAGGG TAC C 109235 

Qy 2877 C C AGGAC C AGAAC AC T GAGGGAGAC TGC AC AG AAAT C AGC CCTGCCCCT GC T G T C AC C C C 2936 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 109234 C C AGGAC C AGAAC AC T GAGGGAGAC TGC AC AG AAAT C AGC CC T GC C CC T GC T GT C AC C C C 109175 

Qy 2937 AGAGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTC 2996 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10 9174 AGAGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTC 109115 

Qy 2997 AGG GAC GGGGAGGC C T TGG TC TGAGAAGGC T GC GC T C AGG TC AG T AGAGGGAGC GTCC C A 3056 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 10 9114 AGGGAC GGGGAGGC C T T GG TC TGAGAAGGC T GC GC T C AGG TC AG T AGAGGGAGC GT C C C A 109055 

Qy 3057 GGC C C TGC C AG GAGT C AAGGT GAGGAC CAAGC GGGC ACC T C AC C C AGG AC AC AT T AAT T C 3116 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10 9054 GGC C C TGC C AG GAGT CAAGGT GAGGAC CAAGC GGGC ACC T C AC C C AGG AC AC AT T AAT T C 108 9 95 

Qy 3117 C AAT GAAT T T T GAT ATC TC TTGC T GCC C T T C C C C AAGGAC C TAGGC AC GT G T GGC C AGAT 317 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 108994 CAATGAATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGAT 108935 

Qy 3177 GTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTC 3236 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 108934 GTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTC 108875 

Qy 3237 TCAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTG 3296 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 108874 TCAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTG 108815 

Qy 3297 AGAAC AG AGGGGGT CAT C C AC TGC ATGAGAGTGGGG ATGT C AC AGAG T C C AG C C C AC C C T 3356 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 108814 AGAAC AGAGGGGGTC AT CC AC T GC AT GAGAGT GGGGATGT C AC AGAGT C C AGC C C AC C C T 108755 

Qy 3357 CCTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGAT 3416 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 108754 CCTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGAT 108695 

Qy 3417 TCCTCTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCA 3476 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I f I I I I I I II I I I I I I I I I I I I II I I I I 
Db 108694 TCCTCTTCC T GGAGC TC C AGGAAC C AGGC AGT GAGGC C T T GGTC T GAG AC AG TAT C C TC A 108635 

Qy 3477 GGTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACA 3536 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 108634 GGTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACA 108575 

Qy 3537 CCAAGGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCT 3596 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I 
Db 108574 C C AAGGGCC C C AC C T GC C ACAGGAC AC ATAGGAC T C C AC AGAGTC T GGC C T C AC C T C C C T 108515 

Qy 3597 ACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACT 3656 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 108514 ACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACT 1084 55 

Qy 3657 TCCTCCTT C AGGT T T TC AGGGGAC AGGC C AAC C C AG AGGAC AGGAT TC C C T GGAGGC C AC 3716 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 108454 TCCTCCTTCAGGTTTTCAGGGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCAC 108395 

Qy 3717 AGAGGAG C AC C AAGGAGAAGAT C T GT AAGT AG GC C T T TGT T AGAGTC T C C AAGGT T C AGT 3776 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I II I I I I I I I I I I I I I I 
Db 108394 AGAGGAGC AC C AAGGAGAAGATC T GTAAGT AG GC C T T TGT T AGAGTC T C C AAGGT T C AGT 108335 

Qy 3777 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 3836 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 108334 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 108275 

Qy 3837 AGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGA 3896 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 108274 AGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGA 108215 

Qy 3897 GGAGTC T GC AC T GC AAGCC T GAGGAAGC C C T T GAGG C CC AAC AAGAGGC C C T GGGC C T GG 3956 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 108214 GGAGTC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGG C CC AAC AAGAGGCC C T GGGC C TGG 108155 

Qy 3957 TGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGG 4016 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 108154 TGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGG 108095 

Qy 4017 TGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCA 4076 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 108094 TGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCA 108035 

Qy 4077 C T AC CAT C AAC T T C AC T CG AC AGAGGC AAC C C AGTGAGGG T TC C AGC AGC C G T GAAGAGG 4136 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 108034 C T AC CAT C AAC T T C AC T C GAC AGAGGC AAC C C AG TG AGGG TT C C AGC AGC C G T GAAGAGG 107975 

Qy 4137 AGG GGC C AAGC AC C T C T T G TAT C C TGGAGT C C T T GT TCC GAGC AG T AATC AC TAAGAAGG 4196 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 107974 AGGGGCCAAGCACCTCTTGTATCCTGGAGTCCT TGT TCCGAGCAGTAATCAC TAAGAAGG 107915 

Qy 4197 TGGCTGATTTGGTTGGTTTTCTGC TCC TCAAATATC GAGC CAGGGAGCCAGTCACAAAGG 4256 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 107914 TGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGG 107855 

Qy 4257 C AGAAAT GC T GGAGAG T GT C AT C AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T T C GGC A 4316 

I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I 
Db 107854 CAGAAATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCA 1077 95 

Qy 4317 AAG C C T C T GAG TC C T TGC AGC TGGT C T T T GGC AT T GAC GT GAAGGAAG C AGAC C C C AC C G 4376 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I II I I 
Db 107794 AAGC C T C TGAG TC C T T GC AGC T GGTC T T T GGC AT TGAC GT GAAGGAAGC AGAC C C C AC C G 107735 

Qy 4377 GCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATA 4436 

I I I I I I II I I I I I I II I II I I II I I I II I I I I IE I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 107734 GCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATA 107675 

Qy 4437 ATC AGAT CATGCCCAAGAC AGGC T TCC T GATAAT TGTCC T GGTC ATGATTGC AATGGAGG 44 96 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 107674 ATC AGAT C ATGCC C AAGAC AGGC T T C C T GATAAT T G TCC T GGTC AT GAT TGC AAT GGAGG 107615 

Qy 4497 GCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATG 4556 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 107614 GCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATG 107555 

Qy 4557 GGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGG 4616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 107554 GGAGGGAGC AC AG T GC C TATGGGGAGC C C AGGAAGC T GC T C AC C C AAG AT T T GGT G C AGG 1074 95 

Qy 4617 AAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGT 4675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 107494 AAAAGTACCTGGAGTACCGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGT 107435 

Qy 4 67 6 GGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGG 4735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 107434 GGGGTC CAAGGGC C CTCGCTGAAACCAGC TAT GTGAAAGTCCT TGAG TAT GTGATCAAGG 107375 

Qy 4 73 6 T C AGT GC AAGAGT TCGCTTTTTCTTCC CAT C C C T GC G TGAAGC AGC T T T GAG AGAGGAGG 47 95 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 107374 T C AGT GC AAGAGT TCGCTTTTTCT TCC CAT C C C T GC GTGAAGC AGC T T T GAG AGAGGAGG 107315 

Qy 4 79 6 AAGAGGGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGC 4855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 107314 AAGAGGGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGC 107255 

Qy 4856 ACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTC 4915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 107254 ACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTC 107195 

Qy 4 916 AC T C T GAAGAGAGC GGTC AG T G T T C TC AGT AG T AGG TTTCTGTTC TAT T GGG TGAC T T GG 4975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 107194 AC T C T GAAGAGAGCGGT C AGT GT T C TC AGT AG T AGG TTTCTGTTC TAT T GGG T GAC T T GG 107135 

Qy 4976 AGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAA 5035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 107134 AGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAA 107075 

Qy 5036 TGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTT 5095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 107074 TGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTT 107015 

Qy 5096 AAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGG 5155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 107014 AAGGGT AAGAG TC T T G TGT T T TAT TC AGAT TG GGAAATC CAT TC TAT T T TG T GAAT T GGG 106955 
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Qy 5156 AT AATAAC AGC AGTGGAAT AAGT AC T T AGAAATGTGAAAAATGAGC AG T AAAATAGAT GA 5215 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 106954 AT AATAAC AGC AGTGGAAT AAGTAC T T AGAAATGTGAAAAATGAGC AG TAAAAT AGAT GA 106895 

Qy 5216 GAT AAAGAAC T AAAGAAAT T AAGAGAT AGTC AAT TC T TGC C T TATACC T CAG T C T AT TC T 5275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 106894 GAT AAAGAAC T AAAGAAAT T AAGAGAT AGTC AAT TC TTGC CT TATACC TCAGTC TAT TCT 1068 35 

Qy 5276 GT AAAAT T T T T AAAGATAT ATGC AT AC C TGGAT TTCCTTGGCTTCTTT GAGAATGT AAGA 5335 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 106834 GT AAAAT T T T T AAAGATAT ATGC AT AC C TGGAT TTCCTTGGCTTCTTT GAGAATGT AAGA 106775 

Qy 5336 GAAATTAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACT 5395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 106774 GAAATTAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACT 106715 

Qy 5396 GAGC AT CTGCTTTTT GGAAGGC C C TGGG T TAG TAGT GGAGATGC T AAG GT AAGC C AGAC T 5455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 106714 GAGC AT CTGCTTTTT GGAAGGC C C TGGG T TAG TAGT GGAGATGC T AAG GT AAGC C AGAC T 106655 

Qy 54 56 CATACCCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAG 5515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 
Db 106654 CATACCCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAG 106595 

Qy 5516 ATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGA 5575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 106594 ATGTCCTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGA 106535 

Qy 5576 GAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTC 5635 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 106534 GAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTC 106475 

Qy 5636 CTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 106474 CTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 106436 
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Query Match 44.3%; Score 2513.6; DB 6; Length 4895; 

Best Local Similarity 79.9%; Pred. No. 0; 

Matches 3415; Conservative 0; Mismatches 694; Indels 165; Gaps 


32; 


Qy 


Db 


1478 ATGGTTC TGAGGGGCGGC T TGAGATCC ACTGAGGGGAGTGGT T T TAGGC TC T GTGAGGAG 1537 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

607 ATAGTCCTGAGGGGCCAGTTGAGATCGGCTGAGGGGAGCGGGCCCAAGCTCTGTGGCGAG 666 


Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 


1538 GC AAGGT GAGATGC T GAGGGAGGAC T GAGGAGGC AC AC AC C C C AGGTAGAT GGC C C C AAA 1597 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II II II 
667 GCAAGGT GAGAC T C T GAGG AAGGAC TGAGGAGGC C C C C AC C C AAGAT AGA- GGAAC C CAA 725 


1598 ATG ATC C AGTAC C AC C C C T GC TGC C AGC CC T GGAC C ACC C GGC C AGGAC AGAT GTC T CAG 1657 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II III I I I I I 
ATAATCCAGCCCACGTCCTGCTGCCAGTCCTGGACCACCCGG GGGAAGACT TC TCA- 781 


726 


1658 CTGGACCACCCCCCGTCCCGTCCCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATA 1717 
III II I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I 
GGCTAGGCCATCCCAGCTCCCACTGCCACTAAAGCTACAGGGGACTCTAGAGTCA-- 836 


782 


1718 GCTTATGTGACCGGGGCAGGGTTGGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGC 1777 

Mil II I I I I I I I I 
AGAGCTTGGTGTGCCCAAGGCAGGGCCAGG 866 


837 


177 8 AT C C GC C C GGC AT T AGGGT C AGGAC CC T GGGAGGGAAC T GAGGG T T C C C C AC C C AC ACC T 1837 

II III Mill II I I I I I II I I II I I I I II II I I M I I I I I I I I I I I I 

867 C T C T GC C T GGC AT C GGGGT C AGGAC C T T GAGAGGGAAC T GAGGGC GC T AC AC C C CC ACC C 926 
1838 GTCTCCTCATCTCCACCGCCACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACC 1897 

I II I I I I II M I I I I I I I I I II 

927 CATCCGCATTC C AAC ATGC C C AGC C C CAT C C C C AAC TCCGTTTT GC AGAA 976 

1898 TCATCTTGTCAGAATCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCAC 1957 
II III II I I I I I II II II I I II I I I I I I I II I I I II II II 

977 TCCATTTTT TCCCCTGCAGTCAACCCCGGGAAGACCTGGGAATGGT CAGGCAC 1029 

1958 TCGGATCTTGACGTCCCCATCCAGGGTCTGATGGAGGGAAGGG GCTTGAACAG 2010 

I I II I II II I I I II I I I I I II II II II III I II I II I 

1030 T C GGATC T T GAC ATC C AC AT C GAGGGC T GAAGGAGGGAGAGAG T T T GG TAT C ATGAGC AG 1089 

2011 GGC C T C AGGGGAGC AGAGG GAG GGCCC TAC T GCGAGATGAGGGAGGC C TCAGAG 2064 

I I M II II I II II I II I I II I II II I III I II I II II I II I II II I I 

1090 AGC C T C AGGGT AGC AGAGGGAGGAC C C T GGC C C TC C T GGGAGAT GAGGAAGGC C TC AGGA 1149 

2065 GACCCAGCACCC T AGGAC AC C GC AC CCCTGTCT GAGAC T GAG — GC T GC C A 2113 

I I II I II II I I I II I I II II I II II I I II I I I I I II I II II 

1150 GAC C C AGC AC C C C AAGGC AGGGAGC CC ACC C C AC C C C T GT C TGAGAAT GAGG T GCC TCC T 1209 

2114 CTTCTGGCCTCAAGAATCAGAACGATGGGGACTCAGATTGCATGGGGGTGGGA — CCCAG 2171 

I I I I II I I I II IE I I II II I I I I I II I I II I II I I I I 

1210 CCTTTAGCCTCAGGAATCCAAGGGATGGCAACTCAGGTCAGCAGAGGGGTGGGTTCCAAG 1269 

2172 GCCTGCAAGGC TTACGCGGAGGAAGAGGAGGGAGGACTCAGGGGACCT TGGAATCCAGAT 2231 

Ml I III I I I II I II I I I II I I I I II I I I II II I I I II I I II II I I 
1270 C C C T T C C AGGATC AAGGAAAGGAAGAC GAGGG AGGAT TC AGGGG GC C T TGC AT TCC AGAT 1329 

2232 CAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATGGCCCATATTTC 2291 

I I I I I II I I I I I II I I I I I II I II I I I II III I I I II I I II I I I I III 
1330 CAGTGGAGACCTGGGCCCTGGGAGGTCCTGGGCAAGGTAGCCACCTGTAGCTCATACTTC 1389 

2292 CTGCATCTTTGAGGT GACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCCTCAGGTC 2347 
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I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1390 C TGC ATC T TCG AGGTC AC AGAGAGGAGAGGGC T ATGGTCTGAGGGGTGGTAC T TC AGGTC 144 9 

Qy 2348 AAC AGAGGGAGGAGT TCCAGGATC CATATGGC CCAAGATGTGCC - CCCTT CATGAGGACT 2406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I 
Db 1450 CGC AGAGGGAGGAGTCCCAGGATC TACAGGACCCAAGGTGTGCCACAC TTCACGAGGAAT 1509 

Qy 2407 GGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTTTTAGTA 2466 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 1510 GGGGATACCTGTGGCTCAGAAAGACGGGACCCCACAGAGTCTGGCTGTCCCCTGTTCTTA 1569 

Qy 24 67 GCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCACAGGCA 2526 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 
Db 1570 GC T C AGG GGGG AC C AGAGG AGGGAT GGC C C T ATG TG C C AAT T T C AC T T GT T C C AC AGGC A 1629 

Qy 2527 GGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCTACTCAT 2586 

I I I I I I I I I I I II I I I I I I I I I II III MM II I II II II II I I I I I II I 

Db 1630 GGAAGT TGGGGAACC TTC AGGGAGATGAGGT T TTGGAGTAAAGGGGCAATGT T TGC TCAT 1689 

Qy 2587 GTC AGGGAATTGGGGGT TGAGGAAGCAC AGGC GC TGGCAGGAAT AAAGATGAGTGAGACA 2646 

I I II I I I I I II I M I I II II I I II I I I III I II I I III I II I II I II 
Db 1690 CTCAGGGGGTTGGGGGTTGAGGAAGGGCAGGCCCTGTCAGGAGCAAACATGAGT-ACCCA 1748 

Qy 2647 GAC AAGGC TAT TGGAATC C AC AC C C C AGAAC C AAAGGGGT C AGC C C T GGAC AC C T C AC CC 2706 

I I I I I II Ml II I I II II I I II I I I I I I II I I I I I I I I I I I II I I III I 

Db 1749 C AG GAGGC CAT C AGAAC C C T C AC C C CAGAAC C AAAGGGGT C AGC C C TGGGC AC C C C AC AC 1808 
Qy 2707 AG GATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGAC 2758 

II I I I I II M I I I I I I I I I I II I I I I I I II II I I I I 

Db 1809 AGGGGT GAC AGGATG TGGC T C C T T C TCAT T TC T GAT TC C AGAT C T C AGT GAGG T GAGGAC 1868 

Qy 2759 C T C AT T C T C AGAGGG T GAC T C AGG T C AAC G T AGGGACC C C CAT C T GGT C T AAAGAC AGAG 2818 

II I I I II I I I I M I I I I I I I II I II I I I I I I I II I II I I I I II II I I I II I II 

Db 18 69 CTTGTTCT C AGAGGG TGAC T C AGG T C AC C AC AGGGACC C C CAT C T GGT C T AC AGAC AC AG 1928 

Qy 2819 CGGTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCC 2878 

II I I I I I I II I I I I I I I I II I II I I I I II I I I I I II I II I I I I I I I I I I I I 

Db 192 9 T GG TC C C AGGAT C TGCC AAGAGT C C TGG T GAGGAAT GT GAGGGAGGAT T GAGGGT AC C AC 1988 

Qy 287 9 AGGAC CAGAAC AC TGAGGGAGAC T GC AC AGAAAT C AGC CCTGCCCCT GC T GT C AC C C C AG 2938 

III I I I I I II I II I III I II I I I I II I I I I II I I I II I I I II I I I II I I I 

Db 1989 AGGGC CAGAAC GC AGAT GAT GAC C C C AC AGAAATC AGC C C TGC TCCTGTTGT CAC C C C AG 2048 

Qy 293 9 AGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAG 2998 

II I I I I I II II I III I I I I I I I I I I II M I I I I II I I M I I I I II I I I I I 

Db 204 9 AGAGCATGGGCTTGGCTTTCTGCTGAGGTCCCTCTCTTATCCTGGGATCACTGGTGTCAC 2108 

Qy 2999 GGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTC AGGTC AGT AGAGGGAGC GTC CC AGG 3058 

III II I I II I I I I I II I I I II I I I I I II I M I II I I I I I I I I I I II I I II I I M 

Db 2109 GGAGGGGGAGGCCTTGGTCTGAGGGGGCTGCACCCAGGTCAGTAGAGGGAGGGTCCCAGG 2168 

Qy 3059 CCC TGCC AGGAGTCAAGGT GAGGAC CAAGCGGGC AC CTC AC CC AGGAC AC AT TAAT TCCA 3118 

I I II I I I I I I I I I I II I I II I I I I I I I III II II I I I I I I I II I I I I II I 
Db 2169 C TC TGC C AGGAG T TG AGGT GAGGACC AAGC AGGC TC CGC AT C C AGGAC AC AT GGG TTC C A 2228 

Qy 3119 ATGAATT T TGAT ATC TCT TGC TGC CC TTC- CCC AAGGACCT AGGC ACGTGTGGCC AGAT G 3177 

I I I I I I II II I II I II II II I III I I I I I I I I I I I II II I I I I II I I I 
Db 222 9 ATGAATTTCGACATCTTTTGCTGTCGTTCTTCGGAAGACCTAGGCACAGGTGGCCAGATG 2288 

Qy 3178 TTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCT 3237 

I I M I I I I I I I II I II I I I I II I I I I I I I I I I I I I I II I 
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Db 2289 TGGGGTTTCTTAGGTCCT GTTCCCTCTCAGGCATGTGAGCTCTTGATCTGAGTTTCT 2345 

Qy 3238 C AGACCAGC AAAAGGGC AGGATCC AGGC CC TGCC AGGAAAAATATAAGGGCC C TGC GTGA 32 97 

III I I I I I I I I I I I I I I I I i I I I I I I II I I III I I I I I I I I I I I I I I I I I I 
Db 234 6 CAGGCCAGCAAAAGAGTGGGATCCAGGCCCTGCCTGGAGAAATGTGAGGGCCCTGAGTGA 24 05 

Qy 3298 GAACAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTC 3357 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 2406 ACACAGT GGGGATCATCCAC TCCATGAGAGTGGGGACC TC ACAGAGTCCAGC C TAC CCTC 24 65 

Qy 3358 CTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATT 3417 

II I I I I I I I II II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2466 TTGATGGCACTGAGGGACCGGGGCTGTGCTTACAGTCTGCACCCTAAGGGCCCATGGATT 2525 

Qy 3418 CCTCTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAG 3477 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I M I 

Db 2526 CC T C TCC TAGGAGC TCCAGGAACAAGGC AGTGAGGC C T TGGTC T GAGACAGT GTCC TCAG 2585 

Qy 3478 GT C AC AGAGC AGAGGAT GC AC AGGGT GT GC C AGC AG T GAAT GT T TGC C C T GAAT GC AC AC 3537 

II I I I II I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I II I I I I I I I I I I 

Db 258 6 GT TAC AGAGC AGAGGAT GC AC AGGC T GT GCC AGC AG TGAAT GT T TGC CC T GAAT GC AC AC 264 5 

Qy 3538 C AAGGGC C C C AC C T GCC AC AGGAC AC AT AGGAC T C C AC AGAGTC TGGCC T C AC C TC C C T A 3597 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 264 6 CAAGGGCCCCACCTGCCACAAGACACATAGGACTCCAAAGAGTCTGGCCTCACCTCCCTA 2705 

Qy 3598 CTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGA-GTACCCTCTCACT 3656 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2706 CCATCAATCCTGCAGAATCGACCTCTGCTGGCCGGCTATACCCTGAGGTGCTCTCTCACT 2765 

Qy 3657 TCCTCCTTCAGGTTTTCAGGGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCAC 3716 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2766 TC C T C C T TC AGGT T C TGAGC AGAC AGGC C AA- C C GGAGGAC AGGAT TCC C T GGAGGC C AC 2824 

Qy 3717 AGAGGAGC AC C AAGGAGAAGAT C T G T AAGT AGGC C T T T GT T AGAGT C T C C AAGGT T C AG T 3776 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III III II II 
Db 2825 AGAGGAGC AC CAAGGAGAAGATC T GT AAGTAAGC C T T TGT TAGAGC C T C T AAGAT T T GG T 2884 

Qy 3777 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 3836 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2885 TCTCAGCTGAGGTCTCTCACATGCTCCCTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCC 2944 

Qy 3837 AGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGA 3896 

I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2945 AGCTTTTGCCTGCACTCTTGCCTGCTGCCCTGAGCAGAGTCATCATGTCTTCTGAGCAGA 3004 

Qy 3897 GGAG T C T GC AC T GC AAGC C T GAGG AAGC C C T T G AGG C C C AAC AAGAGG C C C T GGGC C T GG 3956 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3005 AGAGT C AGC AC T GC AAGC C T GAGGAAGGC GT T GAGGC C C AAGAAGAGG C C C T GGGC C TGG 3064 

Qy 3957 TGTGTGTGCAGGCTGCCAC CTCCTCCTCCTCTCCTC 3992 

I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 3065 TGGGTGCGCAGGCTCCTACTACTGAGGAGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTC 3124 

Qy 3993 TGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTC 4052 

I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I III I I I I I I I II I I I I I 
Db 3125 TGGTCCCTGGCACCCTGGAGGAAGTGCCTGCTGCTGAGTCAGCAGGTCCTCCCCAGAGTC 3184 

Qy 4053 CTCAGGGAGCCTCCGCCTTTCCCAC TAC CATC AAC TTCACTCGACAGAGGCAACCCAGTG 4112 

I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II 
Db 3185 C TC AGGGAGC CTCTGCCT TAC C C AC TAC CAT C AGC T T C AC T TGC T GGAGGC AAC CCAAT G 3244 
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Qy 4113 AGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGT 4172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3245 AGGGTTCCAGCAGCCAAGAAGAGGAGGGGCCAAGCACCTCGCCTGACGCAGAGTCCTTGT 3304 

Qy 4173 TCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATC 4232 

I I I I I I II I III III I I I I I I I III I I I I I I I I I I I I I I I I III I I I I 

Db 3305 TC C GAGAAGC AC TC AGT AAC AAGGT GGATGAG T T GGC TC AT T T T C T GC TC C GC AAG TATC 3364 

Qy 4233 GAGC C AGGGAG C C AGTC AC AAAGGC AGAAATGC T GG AGAG T GT C AT C AAAAAT T AC AAGC 4292 

I I I I I I I I I I I I I II II I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3365 GAGC CAAGGAGC TGG TC AC AAAGGC AGAAATGC T GG AGAG AGT CAT C AAAAAT T AC AAGC 3424 

Qy 4293 ACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTG 4352 

III I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I II 

Db 3425 GCTGCTTTCCTGTGATCTTCGGCAAAGCCTCCGAGTCCCTGAAGATGATCTTTGGCATTG 3484 

Qy 4353 ACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCT 4412 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II II I 

Db 3485 AC G T GAAGGAAGTGGAC CC C AC CAGC AAC ACC T AC ACC C T T GTC AC C T GC C T GGGC C T T T 3544 

Qy 4413 CC T ATGATGGC C TGC TGGGTGATAATCAGATC ATGCC CAAGAC AGGC T TCC TGATAAT TG 4472 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 3545 CCTATGATGGCCTGCTGGGTAATAATCAGATCTTTCCCAAGACAGGCCTTCTGATAATCG 3604 

Qy 4473 TCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGC 4532 

I I I II I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 

Db 3605 TCC TGGGCACAATTGC AAT GGAGGGCGACAGC GCC TC TGAGGAGGAAATC TGGGAGGAGC 3664 

Qy 4533 TGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGC 4592 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 3665 TGGGTGTGATGGGGGTGTATGATGGGAGGGAGCACACTGTCTATGGGGAGCCCAGGAAAC 3724 

Qy 4593 TGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTG 4 651 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I MM 

Db 3725 TGCTCACCCAAGATTGGGTGCAGGAAAACTACCTGGAGTACCGGCAGGTACCCGGCAGTA 3784 

Qy 4652 ATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGA 4711 

II I I II II I I II I I II I I I I I I II II I I II I I I I I II II I I I I I I II II I I I I I I I 

Db 3785 ATCCTGCGCGCTATGAGTTCCTGTGGGGTCCAAGGGCTCTGGCTGAAACCAGCTATGTGA 3844 

Qy 4712 AAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGC 4771 

II I I II I III I II I I III I II I I II I I I I I I I I II I II II I I I I I I II II I 

Db 384 5 AAGTCCTGGAGCATGTGGTCAGGGTCAATGCAAGAGTTCGCATTGCCTACCCATCCCTGC 3904 

Qy 4772 G T GAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGT C TGAGC ATGAGT TG C AGC C AAGGC C A 4831 

II I II I I I I I I I II I I I I I II I II II I I II I I II II I I I I I I II I I I I I I II III 

Db 3905 GTGAAGC AGCT T TGT TAGAGGAGGAAGAGGGAGTC TGAGC ATGAGT TGC AGCC AGGGCTG 3964 

Qy 4832 GTGGGAGGG GGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCT 4887 

I I II I I I I II I I I I I II I I I I II II II I I I I I II II I I II I I I 

Db 3965 TGGGGAAGGGGCAGGGCTGGGCCAGTGCATCTAACA — GCCCTGTGCAGCAGCTTCCCTT 4022 

Qy 4888 GCC TCGTGTGACATGAGGC CCATTCTTC ACTC TGAAGAGAGCGGT CAGT GT TC TCA 4943 

I I I I I II I I I II I I II II II I I I I I II I II I I I I I I I I I II II II II II I 

Db 4023 GCCTCGTGTAACATGAGGCCCATTCTTCACTCTGTTTGAAGAAAATAGTCAGTGTTCTTA 4082 

Qy 4 944 GTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATT 5003 

I I I II I II II I I II I I I I I I II II I II II I I II II II I I I I I II I I I I I I 

Db 4083 GTAGTGGGTTTCTATTTTGTTGGATGACTTGGAGATTTATCTCTGTTTCCTTTTACAATT 4142 
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Qy 5004 GTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTTTATGAATG 5063 

III I I I I I II I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 4143 GTTGAAATG-TTCCTTTTAATGGATGGTTGAATTAACTTCAGCATCCAAGTTTATGAATC 4201 

Qy 5064 ACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAG 5123 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4202 GTAGTTAACGTATATTGCTGTTAATATAGTTTAGGAGTAAGAGTCTTGTTTTTTATTCAG 4261 

Qy 5124 AT T GGGAAATC CAT T C TAT T T TGT GAAT TGGG ATAAT AACAGC AG TGGAAT AAGTAC 5180 

I I I I I I I I II I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 62 ATTGGGAAATC CGTT C TAT T T TGT GAAT TTGGGACATAAT AACAGCAG TGGAGTAAGTAT 4 321 

Qy 5181 T TAGAAATGTG AAAAAT GAGC AGT AAAATAGAT GAGATAAAGAAC T AAAGAAAT TAAGAG 5240 

I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4322 TTAGAAGTGTG AAT TC AC C G TGAAATAGGT GAGAT AAATTAAAAG 4 3 66 

Qy 5241 AT AGTC AAT T C T TGC C T TAT AC C T CAGT C TAT T C TG T AAAAT T T T TAAAGAT ATAT GC AT 5300 

III I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I III M I I I I I I I I 
Db 4367 AT AC TT AAT TCCCGCCTTATGCCTC AGTC TAT TC TGT AAAAT TT AAAAAT AT AT AT GCAT 4426 

Qy 5301 AC C T GGAT TTCCTTGGCTTCTTT GAGAATGTAAGAGAAAT TAAAT C T GAAT AAAGAATT C 5360 

I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 4427 ACCTGGATTTCCTTGGCTTC GTGAATGTAAGAGAAAT TAAAT CT GAAT AAAT AAT TC 4483 

Qy 5361 TTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCT 5420 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 44 84 TTTCTGTTAACTGGCTCATTTCTTCTCTATGCACTGAGCATCTGCTCTGTGGAAGGCCCA 4543 

Qy 5421 GGGT T AG T AGT GGAG AT GC TAAGG TAAG CC AGAC T CAT AC C C AC C C AT AGGG TC GT AGAG 5480 

II I I I I I I I I I I I I I I III 1 I I I I I I I I I I I II III I I I I I I I I I I II 
Db 4544 GGAT TAG TAG T GGAG AT AC TAGGG TAAG CC AG AC AC AC AC C T AC C GAT AGGG TAT T AAGA 4603 

Qy 5481 TCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAGGGAAAA 5540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db . 4 604 GTCTAGGAGCGCGGTCATATAATTAAGGTGACAAGATGTCCTCTAAGATGTAGGGGAAAA 4 663 

Qy 5541 GTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGA 5600 

II I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 

Db 4 664 GT AACGAGTGTGGGTATGGGGCTCCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGT 4 719 

Qy 5601 GCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGTAATGA 5660 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 
Db 4720 G-TGGGGCCTTTTGGGCTTTGGGAAACTCCATTTTCTTCTGAGGGATCTGATTCTAATGA 4778 

Qy 5661 TCTTGGGTGGATCC 567 4 

I I I I I I III 
Db 4779 AGCTTGGTGGGTCC 4792 
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SEQ ID NO 147 
LENGTH: 4 895 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-482-029-147 


Query Match 4 4.3%; 

Best Local Similarity 79.9%; 
Matches 3415; Conservative 


Score 2513.6; 
Pred. No. 0; 
0; Mismatches 


DB 9; Length 4895; 

694; Indels 165; Gaps 


32; 


Qy 


Db 


14 78 ATGGTTCTGAGGGGCGGCTTGAGATCCACTGAGGGGAGTGGTTTTAGGCTCTGTGAGGAG 1537 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

607 ATAGTCCTGAGGGGCCAGTTGAGATCGGCTGAGGGGAGCGGGCCCAAGCTCTGTGGCGAG 666 


Qy 

Db 

Qy 

Db 


1538 GC AAGGT GAGAT GC T GAGGGAGGAC TGAGGAGGC AC AC AC C C C AGGT AGATGGC C C C AAA 1597 
I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I II I I I I II II II 
GC AAGG T GAGAC T C T GAGG AAGGAC T GAGGAGGC C C C C AC C C AAGAT AG A- GGAAC C C AA 725 


667 


1598 ATGATCCAGTACCACCCCTGCTGCCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAG 1657 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I 
726 ATAATCCAGCCCACGTCCTGCTGCCAGTCCTGGACCACCCGG GGGAAGAC T T C T C A- 781 


Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


1658 CTGGACCACCCCCCGTCCCGTCCCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATA 1717 
III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

- - GGC TAGGC C AT CC C AGC T C C C AC T GC C AC T AAAGC TAC AGGGGAC T C T AGAGT C A — 836 


782 


1718 GCTTATGTGACCGGGGCAGGGTTGGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGC 1777 

I I I I II I I I I I II I 
AGAGCTTGGTGTGCCCAAGGCAGGGCCAGG 8 66 


837 


1778 ATC C GC C C GGC AT TAGGGT C AGGAC CC T GGGAGGGAAC T GAGGG T T C C C C AC C C AC AC C T 1837 
II III I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I 
C T C T GC C T GGC ATC GGGGT C AGGAC C T T GAGAGGGAAC T GAGGGC GC TAC AC C C C C AC CC 92 6 


867 


1838 GTCTCCTCATCTCCACCGCCACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACC 18 97 
I II I I I I I I I I I I I I I I I I I II 

927 CATCCGCATTC C AAC AT GC C C AGC C C CAT C C C C AAC TCCGTTTT GC AGAA 97 6 

1898 TCATCTTGTCAGAATCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCAC 1957 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

977 TCCATTTTT TCCCCTGCAGTCAACCCCGGGAAGACCTGGGAATGGT CAGGCAC 1029 

1958 TCGGATCTTGACGTCCCCATCCAGGGTCTGATGGAGGGAAGGG GCTTGAACAG 2010 

I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I I I I 

1030 TC GGAT C T TGAC AT CC AC AT C GAGGGC T GAAGGAGGGAGAGAGT T T GG TAT CAT GAGC AG 108 9 

2011 GGC C T C AGGGGAGC AGAGGGAG GGC CC TAC TGC GAGAT GAGGGAGGCCTCAGAG 2064 

I I I I I I I I I I I I I I I I I I I I I I II I I III I I I I I I I I I I I I I I I I I I 

1090 AGC C TCAGGGT AGCAGAGGGAGGACCC T GGC C C TCC TGGGAGAT GAGGAAGGCC TC AGGA 1149 

2065 GACCCAGCACCC T AGGAC AC C GC AC CCCTGTCT GAGAC TGAG — GC T GC C A 2113 

I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I II II 

1150 GAC C C AGC AC C C C AAGGC AGGGAG C CC AC C C C ACC C C T GT C TGAGAAT GAGG T GC C TC C T 1209 

2114 C TT C TGGCC TC AAGAATC AGAACGATGGGGAC TCAGAT TGCATGGGGGTGGGA — CCCAG 2171 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

1210 CCTTTAGCCTCAGGAATCCAAGGGATGGCAACTCAGGTCAGCAGAGGGGTGGGTTCCAAG 1269 

2172 GC C TGC AAGGC T TAC GC GGAGGAAGAGGAGGG AGGAC T C AGGGG ACC T TGGAAT C C AGAT 2231 

III I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1270 C CC T TC C AGGATCAAGGAAAGGAAGAC GAGGGAGGATT C AGGGG GC C T T GC AT T C C AGAT 1329 
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Qy 2232 CAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATGGCCCATATTTC 2291 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I II I I I I III 
Db 1330 CAGTGGAGACCTGGGCCCTGGGAGGTCCTGGGCAAGGTAGCCACCTGTAGCTCATACTTC 1389 

Qy 2292 CTGCATCTTTGAGGT GAC AG GAC AGAGC TGTGGTCT GAGAAGTGGGGC C T C AGGTC 2347 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1390 C T G CATC T T C GAGGT C AC AGAGAGGAGAGGGC T AT GGTC T GAGGGGT G GTAC T TC AGG TC 1449 

Qy 2348 AAC AGAGGGAGGAGT TCCAGGATC CATATGGCCCAAGATGTGCC - CCCT T CATGAGGAC T 2406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1450 C GC AGAGGGAGGAGT CCCAGGATC TACAGGACCCAAGGTGTGCCACAC TTCACGAGGAAT 1509 

Qy 2407 GGGGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTTTTAGTA 2466 

I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I M I I I I I I I I I II II 
Db 1510 GGGGATACCTGTGGCTCAGAAAGACGGGACCCCACAGAGTCTGGCTGTCCCCTGTTCTTA 1569 

Qy 24 67 GCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCACAGGCA 252 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I II I I I I I I I I I 
Db 1570 GCTCAGGGGGGACCAGAGGAGGGATGGCCCTATGTGCCAATTTCACTTGTTCCACAGGCA 1629 

Qy 2527 GGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCTACTCAT 2586 

I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1630 GGAAGT T GGGGAAC C T T C AGGGAGATGAGGT T T TGGAGTAAAGGGGC AAT G T T T GC T CAT 1689 

Qy 2587 G T C AGGG AAT T GGGG GT TGAGGAAGC AC AGGC GC TGGC AGGAAT AAAGAT GAGT GAGAC A 2 64 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I III I I I II I I II 
Db 1690 CTCAGGGGGTTGGGGGTTGAGGAAGGGCAGGCCCTGTCAGGAGCAAACATGAGT-ACCCA 174 8 

Qy 2 647 GAC AAGGC TAT TGGAAT C C AC AC C C C AG AAC C AAAGGGGT C AGC C C T GGAC AC C T C AC C C 2706 

I I I I I II III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 1749 C AGGAGGC C ATC AGAAC C C T C AC C C C AG AAC C AAAGGGGT C AGC C C T GGGC AC C C C AC AC 1808 

Qy 2707 AG GATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGAC 2758 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1809 AGGGGTGACAGGATGTGGCTCCTTCTCATTTCTGATTCCAGATCTCAGTGAGGTGAGGAC 1868 

Qy 2759 C T C AT T C TC AG AGGG T GAC TC AGG T C AAC GT AGGGAC CC C CATC TGGT C T AAAGAC AGAG 2818 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1869 C T T GT TC TC AG AGGG T GAC TC AGG T C AC C AC AGGGAC CC C CATC T GGT C T AC AGAC AC AG 1928 

Qy 2819 C GG T C CC AGGAT C T G CC AT GC GT T C GGG T GAGGAAC ATGAGGGAGGAC TGAGGG T AC C C C 2878 

I I I I I I I I I I I I I I I II I II I MINIMI I I I I I I I I I I I I I I I I I II I I 
Db 1929 TGGT C CC AGGAT C T GCC AAGAG TC C TGG T GAGGAAT GTGAGGGAGGAT TGAGGG T AC C AC 1988 

Qy 2879 AGGAC C AGAAC AC T GAGGGAGAC T GC AC AGAAAT C AGC CCTGCCCCTGCTGT C AC C C C AG 2938 

III I I I I I I I I II I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1989 AGGGC C AGAAC GC AG AT GAT GAC C C C AC AGAAAT C AGCC C TGCTCCTGTTGT C AC C C C AG 2048 

Qy 2939 AGAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAG 2998 

I I I I I I I I I I I I III I I I I I I I II I M II I I I I I M I I I I I I I II I I I II 
Db 2049 AGAGCATGGGCTTGGCTTTCTGCTGAGGTCCCTCTCTTATCCTGGGATCACTGGTGTCAC 2108 

Qy 2999 GGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGG 3058 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2109 GGAGGGGGAGGCCTTGGTCTGAGGGGGCTGCACCCAGGTCAGTAGAGGGAGGGTCCCAGG 2168 

Qy 3059 C C C TGC C AGGAGTC AAGGT GAGGAC C AAGC GGGC AC C TC ACC C AGGAC AC AT T AAT T C C A 3118 

I I I I I I I I I I I I I I I I I I || I I I I II I III II II I I I I I I I II I I I I I I I 
Db 2169 CTCTGCCAGGAGTTGAGGTGAGGACCAAGCAGGCTCCGCATCCAGGACACATGGGTTCCA 2228 
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Qy 3119 ATGAAT T T T GAT AT CTCTTGCTGCCCTTC - C CC AAGGAC C TAGGC AC GTGT GGC C AGAT G 3177 

I I I I I ! I I It I I I I I II I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2229 ATGAAT T TC GAC AT CTTTTGCTGTCGTTCTTC GGAAGAC C TAGG C AC AGGT GGC C AGATG 2288 

Qy 3178 TTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCT 3237 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2289 TGGGGTTTCTTAGGTCCT GTTCCCTCTCAGGCATGTGAGCTCTTGATCTGAGTTTCT 2345 

Qy 3238 CAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGA 3297 

III I I I I I I I II I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 2346 C AGGC C AGC AAAAGAGT GGGATCC AGGC CC T GC C TG GAGAAATG T GAG GGC C C T GAGTGA 2405 

Qy 3298 GAACAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTC 3357 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2406 AC AC AGT GGGGATC ATC C ACTC C AT GAGAGT GGGGAC C TC AC AGAG T C C AGC C T AC C C T C 24 65 

Qy 3358 CTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATT 3417 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 66 TTGATGGCACTGAGGGACCGGGGCTGTGCTTACAGTCTGCACCCTAAGGGCCCATGGATT 2525 

Qy 3418 CCTCTTCCT GG AGC T C C AGGAAC C AGGC AGTG AGGC CTTGGTCT GAGAC AGT AT C C TC AG 3477 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2526 CC T C T C C TAGG AGC T C C AGGAAC AAGGCAGTGAGGC CTTGGTCT GAGAC AGT GT C C TC AG 2585 

Qy 3478 GTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACAC 3537 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2586 GT T AC AGAGC AGAGGAT GC AC AGGC TGT GC C AGC AG T GAATGT T T GCC C TGAAT GC AC AC 2 64 5 

Qy 3538 CAAGGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTA 3597 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2646 CAAGGGCCCCACCTGCCACAAGACACATAGGACTCCAAAGAGTCTGGCCTCACCTCCCTA 2705 

Qy 3598 CTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGA-GTACCCTCTCACT 3656 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 2706 CCATCAATCCTGCAGAATCGACCTCTGCTGGCCGGCTATACCCTGAGGTGCTCTCTCACT 27 65 

Qy 3657 TC C TC C T TC AG G T T T TCAGGGGAC AGGC C AAC C C AGAGGAC AGGAT TC C C T GGAGGC C AC 3716 

I I I I I I I I I I I I I I I II I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2766 TC C TC C T T C AG G T TC TGAGC AGAC AGGC C AA- C C GGAGGAC AGGAT TC C C T GGAGGC C AC 2824 

Qy 3717 AGAGGAG C AC C AAGGAGAAGAT C T GT AAGT AGGC C T T TGT T AGAGTC T C C AAGGT T C AGT 3776 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III III II II 
Db 2825 AGAGGAG C AC C AAGGAGAAGAT C T GT AAGT AAGC C T T TGT T AGAGC C T C T AAGAT T T GGT 2884 

Qy 3777 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 3836 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2885 TCTCAGCTGAGGTCTCTCACATGCTCCCTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCC 2944 

Qy 3837 AGC TCC TGCCCACAC TCC TGCC TGC TGC CC TGAC GAGAGT CATC ATGTCTCTTGAGCAGA 3896 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2945 AGCTTTTGCCTGCACTCTTGCCTGCTGCCCTGAGCAGAGTCATCATGTCTTCTGAGCAGA 3004 

Qy 3897 GGAG T C T GC AC T GC AAGC C T GAGG AAGC C C T T G AGG C C C AAC AAGAGG CCCTGGGCCTGG 3956 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3005 AGAGTC AGC AC T GC AAGC C T GAGGAAGG CGT TGAGG C CC AAGAAGAGG C C C T GGGC C T GG 3064 

Qy 3957 TGTGTGTGCAGGCTGCCAC CTCCTCCTCCTCTCCTC 3992 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 3065 TGGGTGCGCAGGCTCCTACTACTGAGGAGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTC 3124 

Qy 3993 TGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTC 4052 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3125 TGGTCCCTGGCACCCTGGAGGAAGTGCCTGCTGCTGAGTCAGCAGGTCCTCCCCAGAGTC 3184 

Qy 4053 CTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCGACAGAGGCAACCCAGTG 4112 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 
Db 3185 CTCAGGGAGCCTCTGCCTTACCCACTACCATCAGCTTCACTTGCTGGAGGCAACCCAATG 3244 

Qy 4113 AGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGT 4172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3245 AGGGT TC C AGC AGC C AAGAAGAGGAGGGGC C AAGC AC C TC GC C T GACGC AGAGT C C T T GT 3304 

Qy 4173 TC C GAGC AGTAATC AC T AAGAAGG TGGC T GAT T T GG T TGG TTTTCTGCTCCT C AAATAT C 4232 

I I I I I I II I III III I I I I II I III I I II I I I I I I I I I I I I II I I I I I 
Db 3305 TC C GAGAAGC AC TC AGT AAC AAGG T GGAT GAG T T GGC TC AT T T T C T GC TC C GC AAG TAT C 3364 

Qy 4233 GAGC C AGGGAGC C AG T C AC AAAGGC AGAAATGC T GGAGAG T GT C AT C AAAAAT T AC AAGC 4292 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3365 GAGC CAAGGAGC TGG TC AC AAAGGC AG AAATG C T GGAGAG AGT CAT C AAAAAT T AC AAGC 3424 

Qy 4293 ACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTG 4352 

III II I I I I I I I I I I I II I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I 
Db 3425 GCTGCTTTCCTGTGATCTTCGGCAAAGCCTCCGAGTCCCTGAAGATGATCTTTGGCATTG 3484 

Qy 4353 ACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCT 4412 

I I I I I I I I I I I I I I I I I II I I II II I I II I I I I I I I I I I I I I I I II I I I 
Db 3485 AC G TGAAGGAAG TGGACC C C AC C AGC AAC ACC T AC AC C C T T GT C AC C T GC C TGGGC C T T T 3544 

Qy 4413 CCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTG 4472 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I 
Db 3545 C C TAT GATGGC C T GC TGGG T AAT AAT C AGATC T T T C C C AAG AC AGGC C T T C T GAT AATC G 3604 

Qy 4 473 TCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGC 4532 

I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 

Db 3605 T C C TGGGC ACAAT TGC AAT GGAGGGCGAC AGC GC C T C T GAGGAGGAAAT C T GGGAG GAGC 3664 

Qy 4533 T GAGTGT GAT GGAGG TG T AT GAT GGGAGGGAG C AC AGT GC C TAT GGGGAGC C C AGGAAGC 4592 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 3665 TGGGTGT GAT GGGGGTGT AT GATGGGAGGGAGC AC AC TGTC TAT GGGGAGC CCAGGAAAC 3724 

Qy 4593 TGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTG 4651 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3725 TGCTCACCCAAGATTGGGTGCAGGAAAACTACCTGGAGTACCGGCAGGTACCCGGCAGTA 3784 

Qy 4652 ATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGA 4711 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I 
Db 3785 ATCCTGCGCGCTATGAGTTCCTGTGGGGTCCAAGGGCTCTGGCTGAAACCAGCTATGTGA 3844 

Qy 4712 AAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGC 4771 

I I I I I I I III I I I I I III I I I I I I I I I I I I I I I I II II I L I I I I I I I I I II 
Db 3845 AAGTCCTGGAGCATGTGGTCAGGGTCAATGCAAGAGTTCGCATTGCCTACCCATCCCTGC 3904 

Qy 4772 GT GAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGTC T GAGC AT GAGT TGC AGC C AAGGC C A 4831 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 3905 GT GAAGC AGC T TTGT TAGAGGAGGAAGAGGGAGTCTGAGCATGAGTTGCAGCCAGGGCTG 3964 

Qy 4832 GT GGGAG GG GGAC TGGGC C AGT GC AC CTTCCAGGGCCGCGTCC AGC AGC TTCCCCT 4 887 

I I I I I I I I I I I I I I I I II I I I I I II III I I I I I I I I I I I I I I I 

Db 3965 TGGGGAAGGGGCAGGGCTGGGCCAGTGCATCTAACA--GCCCTGTGCAGCAGCTTCCCTT 4022 

Qy 4888 GCCTCGTGTGACATGAGGCCCATTCTTCACTC TGAAGAGAGCGGTCAGTGTTCTCA 4943 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
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Db 4023 GCCTCGTGTAACATGAGGCCCATTCTTCACTCTGTTTGAAGAAAATAGTCAGTGTTCTTA 4082 

Qy 4944 GTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATT 5003 

Mill I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I INI 
Db 4083 GTAGTGGGTTTCTATTTTGTTGGATGACTTGGAGATTTATCTCTGTTTCCTTTTACAATT 4142 

Qy 5004 GTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTTTATGAATG 5063 

III INN II I I I I I I MINIMUM I I I M I I I II II II I I II I I I I I M 
Db 4143 GT T GAAAT G- T T CC T T T T AAT GGAT GG T T GAAT TAAC T T C AGC ATC C AAGT T T ATGAATC 4201 

Qy 5064 ACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAG 5123 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I II I I I I I 

Db 4202 GT AGT T AAC GT ATAT T GC T GT T AAT ATAGT T T AGGAGT AAGAGT C TTGTTTTT TAT TC AG 4261 

Qy 5124 AT T GGGAAAT C C AT TC TAT T T T GT GAAT TGGG ATAATAACAGCAGTGGAATAAGTAC 5180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II II I I 
Db 42 62 AT T GGGAAAT C CGT T C TAT T T T GT GAAT T T GGGAC ATAAT AAC AGC AGTGGAGT AAGTAT 4 321 

Qy 5181 T TAGAAATG T GAAAAAT GAGC AGT AAAAT AGATGAGATAAAGAAC T AAAGAAAT T AAGAG 5240 

I I I I I I I I I I III I II I I I II I I I II I I I I I I I IE I I 

Db 4 322 TTAGAAGTGTG AATTCACCGTGAAATAGGTGAGAT AAATTAAAAG 4 3 66 

Qy 5241 ATAGT C AAT T C T TGC C T TAT AC C T C AGT C TAT TC T G T AAAAT T T T T AAAGAT AT AT GC AT 5300 

III I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 4367 AT AC T T AAT T C C C GC C T TAT GC C T C AGT C TAT T CT G TAAAAT T T AAAAAT AT AT AT GC AT 4 426 

Qy 5301 AC C TGGAT T T C C T TGGC T T C T T T GAGAAT GTAAGAGAAAT T AAATC T GAATAAAGAAT TC 5360 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4427 ACCTGGATTTCCTTGGCTTC GTGAAT GTAAGAGAAAT TAAATCTGAATAAATAATTC 4483 

Qy 5361 TTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCT 5420 

II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4484 TTTCTGTTAACTGGCTCATTTCTTCTCTATGCACTGAGCATCTGCTCTGTGGAAGGCCCA 4543 

Qy 5421 GGG TTAG T AGT GGAGATGC T AAGG TAAGC C AGAC TC ATAC C C AC CC AT AGGG T C GT AGAG 5480 

II I I I I I I I I I I I I I I III I I I I I I II I I I I II III III I I I I I I I II 
Db 454 4 GGATTAGTAGTGGAGATAC TAGGG TAAGC CAGACAC ACAC C TAC CGAT AGGGTATT AAGA 4 603 

Qy 5481 TCTAGGAGC TGC AGT CACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGT AGGG AAAA 5540 

I I I I I I I MM I II II I I I II I I I I II II II II I II I I 

Db 4604 GTC TAGGAGC GCGGTC AT ATAAT T AAGG T GAC AAGAT GTC C TC TAAGATGTAGGGGAAAA 4 663 

Qy 5541 GTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGA 5600 

II I I III II II I II I I I II I II II II I I I II I I I I II III II I I I 

Db 4 664 GT AACGAGTGTGGGTATGGGGCTCCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGT 4719 

Qy 5601 GC T GGGGC AT T T T GGGC T T T GGGAAAC T GC AG TTCCTTCT GGGGGAGC T GAT T GT AAT G A 5660 

I I II I I I II I II II I II II I I I I I I I II II I II II I MM I II I I I I II I II 

Db 4720 G-TGGGGCCTTTTGGGCTTTGGGAAACTCCATTTTCTTCTGAGGGATCTGATTCTAATGA 4778 

Qy 5661 TCTTGGGTGGATCC 5674 

I II II I III 
Db 477 9 AGCTTGGTGGGTCC 47 92 
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TITLE OF INVENTION: Oncology drug innovation 
FILE REFERENCE: P 573 PCOO 

CURRENT APPLICATION NUMBER : US/10/4 82,029 
CURRENT FILING DATE: 2003-12-29 
NUMBER OF SEQ ID NOS : 437 
SOFTWARE: Patentln version 3.1 
SEQ ID NO 87 
LENGTH: 4 741 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-482-029-87 

Query Match 42.7%; Score 2422.8; DB 9; Length 4741; 

Best Local Similarity 75.7%; Pred. No. 0; 

Matches 372 6; Conservative 0; Mismatches 8 82; Indels 314; Gaps 4 6; 

Qy 715 TTCCCGCCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGG 774 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 15 TTCAACCCAGGGAATCCCTGGGTGACCAGATGTGGTGCCACTGTCTTGCACATTTGAGGT 74 

Qy 775 CAGAGAGAAGC GAGGTTTC CATTC TGAGGGAC GGCGTAGAGT TC GGCC GAAGGAAC C TGA 834 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 75 CGGAGAGAAGCAAGGGCCTCGCTC TCAGGGGCAGC - TGGAGATCAGCTGAGGGCAGC TGG 133 

Qy 835 C C C AGGC T C T G T GAG GAGG C AAGG TGAGAGGC T GAGGGAGGAC T GAGGAC C C C GCC AC T C 8 94 

III I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I MM I 

Db 134 C C C TGGC TC T G T GAGGATGC AAGG T GAG AT GC TGAGGGAGGAC T AAGGAG TAT C CC ACC C 193 

Qy 895 C AAAT AGAGAGC C C C AAAT AT T CC AG CCCCGCCCTTGCTGCCAGCCCTGGCCCACCC 951 

I I I I I I II I I I I I I II I I I I I I I I I I II II I I I I I I I II I I I 
Db 194 CTGGTAGTGGACCCCAAATAATCCAGTGCCACCTCTCCTGCTGCTAGCTCTGGACCATCC 253 

Qy 952 GC GGGAAGAC G T C TC AGC C TGGGC TGC C C C C AGAC CCCTGCTC C AAAAGC C T T GAG AGAC 1011 

I I I I II II I II I I II I I I I I I I I I II II I I I I II I I II 

Db 254 AGGGCAGGACTTCTT AGGC TGGGC C ACC CCCAGTCCCCCACCGCTTAAGCCGCAGGGGA- 312 

Qy 1012 ACCAGGTTCTTCTCCCCAAGCTCTGGAATCAGAGGTTGCTGTGACCAGGGCAGGACTGGT 1071 

III III I II II III I II I II I I I I II I II I I II I 
Db 313 CTCAGGAGACAGAGCTTGGTATGACCAGGGCAGGACTGGT 352 

Qy 1072 TAGGAGAGGGC AGGGCACAGGC TC TGCC AGGC ATCAAGATCAGC ACCC AAGAGGGAGGGC 1131 

I II I I I I I I II I I II I I I I I I I II I I I I I I I II I I I I I I I I I 
Db 353 TAGGAGAGGAC AGC T C CC A-GC TC T GC C AGGAAAC AAC G T C AGGAAC C T AAGGGAAAGC T 411 

Qy 1132 TGTGGGCCCCCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCC 1191 

I I II I 

Db 412 GAGGCTACCCC 422 

Qy 1192 CACCCAACCCCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCAC 1251 

I I I I I I I I I I II I I II II I I 
Db 423 CACCCCAAACTCTATTCCTGTCCCTACCTCCGTCC 4 57 

Qy 1252 CTGACCACCACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACT 1311 

I II I II I II I II II M II I I II I I I I I II II I I II I 

Db 4 58 CCCACCTACACCCCCCATTCC CCCACCCCTTCCCTACCGGCACCTCTATCCCACA 512 

Qy 1312 GCCCCCAACCCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTG 1371 

M I I II II I I II I II 

Db 513 TCCCCCA CCCCTATCCTG 530 

Qy 1372 GCAGAATCCGGTT-TGCCCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAA 1430 


http://es/ScoreAccessWeb/GetItem.action? Appld=088 1 9669&seqld=6095 1 9&ItemName=us.. . 8/30/06 


1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 

Db 531 GC AGAAT C C GAT T C T GCC C C TGAT T TC AACCC AGGGAAGC C C T AGGGGGC C GGATG TGAT 590 

Qy 1431 AC C AC TGAC T T GAAC C TC AC AGAT C TGAGAGAAGCC AGGT TC AT T TAATGGT TC TGAGGG 1490 

I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I 

Db 591 GC T GC T GAC T T GTGC AT TGGGGGT C AGAGAGAATC AAGG GCATGGTTCTGAGAA 644 

Qy 14 91 GC GGC T T GAGATC C AC TGAGGGGAG TGG TT T T AGGC T C TG TGAGGAGGC AAG GTGAGAT G 1550 

III I f I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 645 GC C GAC T GAGATC AGCAGAGGGGAATGGGC C C GGGC TC T G TGAGGAGGCAAGGT GAGAC C 704 

Qy 1551 C T - GAGGGAGGAC TGAGGAGGCAC AC AC CC CAGGTAGATGGCC CC AAAATGATCCAGTAC 1609 

I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I 

Db 705 C CC GAGGAAGGAATGAGGAAGCCC TCAC CC - - AGATAGAGAACC C CAAATAATCCAGTAC 7 62 

Qy 1610 C AC C C C T GC T GC C AGC C C T GGACC ACC C GGC C AGGAC AGAT GTC T C AGC TGG AC C AC C C C 1669 

III I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II III II 

Db 763 TACCTTTGCTGCCAGCCCTGGACCAC C C AGGGC AG AC T T C TC AGGC T GAAC C T T C C 818 

Qy 1670 CCGTCCCGTCCCACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTT-ATGTGAC 1728 

I III I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 819 C C C C TC C C C AC T GC CAC T TAAG CC AC AAGGGAC T C TGGAGT C AGAC C T TGG TGT GAC 875 

Qy 1729 CGGGGCAGGGTTGGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGC 1788 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 87 6 CAGGGAAGGGC CGGT CAGGAGAGG GCAGGGGCCAGGCTCTGTCAGGC 922 

Qy 1789 ATTAGGGTCAGGACCCTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCTCATC 1848 

III I I I I I I I I I I I I I I I I I I I I I I I Ell I I I I II II I 

Db 923 AT C AAAAT C AGGAC C C T GAGAGAGAAT T GAGGGC CC C C AC CC C AAC C C C TAT AC C C ATC C 982 

Qy 1849 TCCACCGCCACCCCACTCACATTCCCATACCTACC CCCTACCCCCAACCTCATCTT 1904 

I I I I I I I I I I I III III El I I I I I I I I I I I I I I I I I 

Db 983 CTAACCCCATACCCACTCTACTTGCATTCCCAGCCCCATCCCCACACCCTACCCCATCTT 1042 

Qy 1905 GTCAGAA TCCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGG 1954 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1043 GGC AGAAT CTGTTTCTTTCCC TGC AGTC AAC C C AC AGAAGCC C C AGGAATGAC AGAC AGG 1102 

Qy 1955 CAC T C GGAT C T TGAC GTC C C C ATC C AGGGT C T GATGGAGGGAAGGG GCTTGAA 2 007 

I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1103 CAC ACC TAT TC TGAC GTC CAC ATC C AGGGC TGAAGGAGGGAAAGGGC T TAGTATCATGAG 1162 

Qy 2008 CAGGGCCTCAGGGGAGCAGAGG GAGGGC C C T AC TGC GAG AT GAGGGAGGC C T C AGA 2063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1163 CAGGGCCTCAGGGGAGTCTCTGCTCCTCAAGCCCTGCTGGGAGTAAAGGGAGGCCTCAGG 1222 

Qy 2064 GG AC C C AGC AC C C T AGGA CAC C GC ACC CC T G TC TG AGAC TGAG — GC T GC C 2112 

I I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I II II 

Db 1223 GAACCCAGGTCCTCAGGATAGGGGGTCCACTCCAACCCTGTCTGAGACTGAGGCGCCTCC 1282 

Qy 2113 AC TTCTGGCCT C AAGAATC AGAAC GAT GGGGAC TC AGAT T GCAT GGGG GT GGGAC C C AGG 2172 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1283 TCTTTCATCCTCGGGAATCACAGGGATGGAGACTCACGTCAGCAGAGGGTGGGGCCCAAC 1342 

Qy 2173 C C T GC AAGGC T T AC GC GGAGGAAGAGGAGGGAGGAC T C AGGGGAC C T T GGAATC C AGATC 2232 

I I I I I III I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1343 C C T GC C AGGAT C AAGGAGAGGAAGAAGAGGGAGGAC T C AGGGT AC C T T T GAG TCC AGAAC 1402 

Qy 22 33 AGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATGGCCCATATTTCC 2292 

I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
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Db 1403 AATGGGGACCTTTGCCCTGGGAGGTCCAGTGCACAGTGGCCACCTGTAGCCCATGCTTGC 1462 

Qy 2293 TGC ATC T T TGAGGTGAC AGGAC AGAGC TGT GGTC TGAGAAGT GGGGCC TC AGGTC A 2348 

i I I I II I I I I I I I I I I I II I I I I I I I I I III I I I I I I MINIMI 

Db 1463 TGCACCTTCTGGGTGACAAAGAGGAGAGGGCTGTGGTCAGAGCAGTGGTGACTCAGGTCA 1522 

Qy 2349 ACAGAGGGAGGAGTT CCAGGATCCATATGGCCCAAGATGT GCCC CC T TCATGAGGAC TGG 2408 

I I I M I I I I I I I I I I I I III I I I I I I I II I I I I I I I I I I I I I II III 
Db 1523 GCAGAGGGAGGAGTCCCAGCATCTGCAGGCCCCAATGTGTGCCCCATTCATGAAGATTGG 1582 

Qy 2409 GGATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTTTTAGTAGC 2468 

I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1583 GGAT A- C C T TGGC T C AGAAAGAAGGGAC C C C AC AG AGTC TGGC T GT C C C C TGAT T T T TGC 1641 

Qy 24 69 TCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCACAGGCAGG 2528 

II I I I I I I M I I I I I I I I I I I I I II II I I I I I I I I I I I II I II I I 

Db 1642 TCAGAGGGGACCAAATCAAGGATAGCCCTATGTGCCAACCTCATTTGTGCCACAGGAAAG 1701 

Qy 2529 AAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCTACTCATGT 2588 

I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I III I I I I I I 
Db 1702 AAG T TGAAGAGC C C T C AGGGT GAT GGGG T C T T GC AG TAAAGGGG AGC TAT C T GC TC AT C T 1761 

Qy 2589 CAGGGAAT TGGGGGT TGAGGAAGC AC AGGCGC TGGC AGGAATAAAGATGAGT GAGACAGA 2648 

I I I I I II I I I I I I I I I I I I I I I I I I I I II II II 
Db 1762 CAGGGGG T T TC AGGT TGAGGAATGGCAGGCCC CATC ACGATGAAGAGT AACC C ACAGG- - 1819 

Qy 2649 C AAGGC TAT T GGAAT C C AC ACC C C AGAAC C AAAGGG GTC AGC C C TGGAC AC C TC A 2703 

II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1820 AGC C AT AGAAAC ACT C ACC C C AGAAC C AAAGGGGTC AT AC C T GGAC AC C C C ATG TGG 187 6 

Qy 2704 CCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACC 2759 

I I I I I I I I II II I III I I I I I I I I I I I I I I I III I I I I I I I I I I 
Db 1877 GGGTGACAGGATGTAGC-TCCATCTCATTCCTGTTTTCAGATCTCGGGGAGGTGAGGAAC 1935 

Qy 2760 TC AT TCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCC ATC T GGTC TAAAGAC AGAGC 2819 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1936 TTGTTCTCC GAGGAT GAC T C AGGT C AAC AC AGGGGC C CC C AT C T GG T G GAT AGAC AGAGT 1995 

Qy 2820 GGTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCA 2879 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1996 GGT C C C AGGAT C TGT C AGT AGT T C C GGT GAGGAAC ATGAGGGAC GAT T GAGGGC AC CC T T 2055 

Qy 2880 GGAC C AGAAC AC TGAGGGAGAC T GC AC AGAAAT C AGC CC T GC C C C TGC T GT C AC CC C AGA 2939 

II I I I I I I I I I II I III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2056 GGG C C AGAAC AC AGATGAGGAC C T C AC GGAAAT CTGCCCTGCCCCTGC T GT C AC T C C AGA 2115 

Qy 2940 GAGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCC — GTTATCCTGGGATCATTGATGTCA 2997 

I I I I I I I I I I I I I I I I I II I I I I I I II III I I I I I I I I I I I I I I I I I I 
Db 2116 GAGCATGGGCAGGGCTGTCTGCTGCAGTCCCCCCCACTTACCCTGGGATCATTGGTGTCA 2175 

Qy 2998 GGGACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAG 3057 

I I I I I I I I I I I III III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2176 GGGATGGGGAGGTCTTTGTC-GAGGGGTCTGCACTCAGGTCAGTAGAGGGAGCGTCTTAG 2234 

Qy 3058 GCCC TGC CAGGAGTCAAGGTGAGGACCAAGCGGGCACCTCACCCAGGACACATTAATTCC 3117 

I I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2235 GC C C T GC C AGGAGAC AAGGT AAGAAC GAAGC AGGT T C C T C AC C C AGGAC AC ATGAAT T C C 2294 

Qy 3118 AATGAATTTTGATATCTCTTGCTGCCCTTCCCCA-AGGACCTAGGCACGTGTGGCCAGAT 3176 

I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2295 AATGCATTTCAGCATCTCTTCCTGTCCTTCCCAAGAGGACCTGGGCACGTGTGGCCAGAT 2354 
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Qy 3177 GTTTGTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTC 3236 

II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2355 GTGAGTCTCCTCATGTCCT GTTCCCTATCAGGGATGTGAGCTCTTAATCTGAGTTTC 2411 

Qy 3237 TCAGACCAGCAAAAGGGCAGGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTG 3296 

I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I III I I I I I I I I I I III 
Db 2412 TCAGGCCAGCAAAAGGGTGGGATCCAGGCCTTGCCAGGAGAAAGGTGAGGGCCCTGTGTG 2471 

Qy 3297 AGAAC AG AGGGGGT C ATC C AC TGC ATGAGAGT GGGGAT GT C AC AGAGT CC AGC C C AC C C T 3356 

I I I I I I I I I I I Ml III I I I I I I I I I I I I I I II I I I I I I I II I I I I I 

Db 2472 AGC AC AG AGGGGACC AT TC AC C CC AAGAGGGT GGAGAC C T C AC AGAT T CC AGC C TAC C C T 2531 

Qy 3357 CCTGGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGAT 3416 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II II 
Db 2532 CCTGTTAGCACTGGGGGCCTGAGGCTGTGCTTGCAGTCTGCACCCTGAGGGCCCATGCAT 2591 

Qy 3417 TCCTCTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCA 3476 

I I I I I I I I I I I I I I I I I I I I I I 111 II I I I I I I I I I I I I I I I I I I II II I I I 
Db 2592 TCCTCTTC C AGGAGC TCC AGGAAAC AGAC AC T GAGGC C T T GGT C TGAGGC C GTGC C C TCA 2651 

Qy 3477 GGT CACAGAGCAGAGGATGCAC AGGGT GTGCCAGCAGTGAATGTTTGCCCTGAATG 3532 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 652 GGT CACAGAGC AGAGGAGATGCAGACGT C TAG TGC CAGCAGTGAACGT TTGCC T TGAATG 2711 

Qy 3533 C AC AC C AAGGGC C CC ACC T GC C AC AGGAC AC AT AGGAC T C C AC AGAGT C TGGC C TCA- C C 3591 

I I I I I II I I I I I I III III III II I I I I I I I I II I I I I I I I I I II 

Db 2712 C AC AC T AAT GGC C CC C AT C GC C CC AGAAC AT AT GGGAC T C C AGAGC AC C TGGC C TC AC C C 2771 

Qy 3592 TCCCTACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTC 3651 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2772 TCTCTACTGTCAGTCCTGCAGAATCAGCCTCTGCTTGCTTGTGTACCCTGAGGTGCCCTC 2831 

Qy 3652 TCACTTCCTCCTTCAGGTTTTCAGGGGACAGGCCAACCCAGAGGAC A 3698 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II II I 
Db 2832 T C AC TTTTTCCTT C AGGT T C T C AGGGGAC AGGC TGAC C AG GAT C ACC AGGAAGC T C C AGA 2891 

Qy 3699 GGAT TC C C TGGAGGC C AC AGAGGAGC AC C - AAGGAGAAGAT C T GTAAGT AGGC C T T TG T T 3757 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2892 GGAT CC C C AGGAGGC C C T AGAGGAGC AC C AAAGGAGAAGAT C T G TAAG T AAGCC T T TGT T 2951 

Qy 3758 AGAGTC T C C AAGGT T C AGT TC T C AGC T GAGGC C TC T C AC AC AC TCCCTCTCTCCC C AGGC 3817 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2952 AGAGC C T C CAAGGT T C AGT TT T TAGC T GAGGC T TC T C AC AT GCTCCCTCTCTCT C C AGGC 3011 

Qy 3818 CTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTC 3877 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 
Db 3012 CAGTGGGTCTCCATTGCCCAGCTCCTGCCCACACTCCTGCCTGTTGCGGTGACCAGAGTC 3071 

Qy 3878 AT C AT GT C T C T TGAGC AGAGGAGT C T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C C AA 3937 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3072 GTCATGTCTCTT GAGC AGAAGAGT C AGC AC T GC AAGC C T GAGGAAGGC CT TGAC AC C C AA 3131 

Qy 3938 CAAGAGGCCCTGGGCCTGGTGTGT GTGC AGGC TGCC AC C 397 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3132 GAAGAGGCCCTGGGCCTGGTGGGT GTGC AGGC TGCC AC TAC TGAGGAGCAGGAGGCTGTG 3191 

Qy 3977 TCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACA 4036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3192 TCCTCCTCCTCTCCTCTGGTCCCAGGCACCCTGGGGGAGGTGCCTGCTGCTGGGTCACCA 32 51 
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Qy 4037 GATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCGA 4096 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3252 GGTCCTCTCAAGAGTCCTCAGGGAGCCTCCGCCATCCCCACTGCCATCGATTTCACTCTA 3311 

Qy 4097 CAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGT 4156 

I I I I I I I III I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3312 T GGAGGC AAT C CAT T AAGG GC TC C AGC AAC C AAGAAGAGGAGGG GCC AAGC AC C T C C C C T 3371 

Qy 4157 AT C C T GGAGTC CTTGTTCC GAGC AGTAAT C AC TAAGAAGG TGGC T GAT T T GG T TGGT T T T 4216 

II I I I I I I I I I I I I I I I I I I III I I I I I I I M I I I I I I III II I I I I 

Db 3372 GAC C C AGAGTC TGT G T TCC GAGC AGC AC T C AG TAAGAAGG TGGC T GAC T T GAT TC AT T T T 3431 

Qy 4217 CTGCTCCT CAAAT AT C GAGCC AGGGAGC C AGT C AC AAAGGC AGAAAT G C TGGAGAGTGTC 427 6 

I I I I I I I I I I I III II II Mill I I I I I I I II I I I I I I I I I I M I I I II I I I 
Db 3432 CTGCTCCT C AAGT AT T AAG TC AAGGAGC TGGT C AC AAAGG C AGAAAT G C TGGAGAGC GTC 3491 

Qy 4277 ATC AAAAAT TAC AAGC AC T GTT T T CCT GAGAT C T TCGGC AAAGC C TC T GAGT C C T T GC AG 4336 

I I I I I II I I If I I I I I I II I I I II I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I 
Db 34 92 ATCAAAAATTACAAGCGCTGCTTTCCTGAGATCTTCGGCAAAGCCTCCGAGTCCTTGCAG 3551 

Qy 4337 CTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTC 4396 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I 
Db 3552 CTGGTCTT TGGC AT T GAC G T GAAGGAAGC GGAC C C C AC C AGCAAC ACC TAC AC C C T T GT C 3611 

Qy 4397 ACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTG AT AAT C AGAT C AT GC C C AAG 4453 

I I I I I II I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3612 ACCTGCCTGGG— ACTCCTATGATGGCCTGCTGGTTGATAATAATCAGATCATGCCCAAG 3669 

Qy 4454 ACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAG 4513 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3670 ACGGGCCTCCTGATAATCGTCTTGGGCATGATTGCAATGGAGGGCAAATGCGTCCCTGAG 3729 

Qy 4514 GAGGAAATC T GGGAGGAGC T GAGT G TGAT GGAGG TGTAT GATGGGAGGGAGC AC AGT GC C 4 573 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3730 GAGAAAATC T GGGAGGAGC T GAGT GTGAT GAAGGTGT AT G T TGGGAGG GAGC AC AGTGTC 3789 

Qy 4574 TAT GGGGAGCCCAGGAAGC TGC TCACC C AAGAT TTGGTGC AGGAAAAG TACC TGGAGTA- 4 632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3790 TGT GGGGAGC C C AGGAAGC TGC T C ACC C AAGAT T T GGT GC AGGAAAAC TAC C TGGAG TAC 3849 

Qy 4 633 CGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTC 4 692 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 3850 CGGCAGGTGCCCAGCAGTGATCCCATATGCTATGAGTTACTGTGGGGTCCAAGGGCACTC 3909 

Qy 4693 GCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGC 4752 

I I I I I I I I I I I II III I III III I I I I I I I I I I I II I II I 

Db 3910 GCTGCT TGAAAGTACTGGAGCACGTGGTCAGGGTCAATGCAAGAGTTCTC 3959 

Qy 4753 TTTTTCTTCC CAT C C C T GC GTGAAGC AG C T T T GAGAGAGGAGGAAGAGGGAG T C T GAGC A 4812 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3960 AT T TCC TAC C C AT C C C T GC GTGAAGC AGC T T T GAGAGAGGAGGAAGAGGGAG T C T GAGC A 4019 

Qy 4813 TGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGT 4872 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 4020 TGAGCTGCAGCCAGGGCCACTGCGAGGGGGGCTGGGCCAGTGCACCTTCCAGGGCTCCGT 407 9 

Qy 4873 CCAGCAGCTTCCCCTGCC-TCGTGTGACATGAGGCCCATTCTTCACTC — TGAAGAGAGC 4929 

I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I III I I I I I I I I I I 
Db 4080 C C AG TAG TTTCCCCTGCCT T AATG T GAC AT GAGGC C CAT TC.TTCTCTCT T TGAAGAGAGC 4139 

Qy 4930 GGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGT 4989 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 4140 AGTCAACATTCTTAGTAGTGGGTTTCTGTTCTATTGGATGACTTTGAGATTTGTCTTTGT 4199 

Qy 4 990 TCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATC 504 9 

I I I I I I I I I I I I II I I I I I I I III I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 4200 TTCCTTTTGGAATTGTTCAAATG-TTTCTTTTAATGGGTGGTTGAATGAACTTCAGCATT 4258 

Qy 5050 C AAGT T T AT GAAT GAC AGC AGTC AC AC — AGT T C T GT G TAT ATAGT T T AAGGGT AAGAGT 5107 

III I I I I I I I I I I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4259 C AAAT T TAT GAAT GAC AGT AGTC AC AC ATAGT GC T G T T TAT ATAGT T T AGGAGTAAGAGT 4318 

Qy 5108 CTTGTGTTT TAT T C AGAT T GGGAAAT C CAT T C TAT T T TGT GAAT T GGG — ATAATAACAG 5165 

I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 
Db 4319 CTTGTTTTT TAT TC AGAT T GGGAAATC C AT T C CAT T T TG T GAAT T GGGAC AT AGT T AC AG 4378 

Qy 5166 C AG TGGAAT AAGTAC T TA- GAAAT GTGAAAAATGAG C AGT AAAAT AGATGAGATAAAGAA 5224 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 37 9 C AG TGGAAT AAG TAT T CAT T TAGAAATG T GAATGAGC AGT AAAAC T GAT GAC A 44 31 

Qy 5225 C T AAAGAAAT T AAGAGAT AGTC AAT TC T T GC C T T AT ACC T C AGT C TAT T C T G T AAAAT T T 5284 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I II I I I 

Db 4432 - TAAAGAAAT T AAAAGAT AT T T AAT T C T T GC T TAT AC T C AGTC T AT TC GGT AAAAT T T T T 44 90 

Qy 5285 T TAAAGATAT ATGC AT AC C T GGAT T TC C T TGGC T T C T T T GAGAATGTAAGAGAAAT T AAA 5344 

II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4491 T T T AAAAAAT G T GC AT AC C T GGAT T T C C T T GG C T T C T T TGAGAATGT AAGAC AAAT T AAA 4550 

Qy 5345 TCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTG 5404 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I II 

Db 4 551 TCTGAATAAATCATTCTCCCTGTTCACTGGCTCATTTATTCTCTATGCACTGAGCATTTG 4 610 

Qy 54 05 CTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCAC 54 64 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II II 

Db 4 611 CTCTGTGGAAGGCCCTGGGTTAATAGTGGAGATGCTAAGGTAAGCCAGACTCACCCCTAC 4 670 

Qy 54 65 CCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCT 5524 

III I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4671 CCACAGGGTAGTAAAGTCTAGGAGCAGCAGTCATATAATTAAGGTGGAGAGATGCCCTCT 4730 

Qy 5525 AA 5526 

I I 

Db 4731 AA 4732 
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Query Match 42.4%; Score 2408; DB 7; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 3256 GGAT C C AGGC C C T GC CAGGAAAAATATAAGGGC C C T GCGT GAGAAC AGAGGGGGTC ATC C 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGAT C C AGGC C C T GC CAGG AAAAATAT AAGGGC C C T GC GT GAGAAC AG AGGGGG TC ATC C 60 

Qy 3316 AC T GC AT GAGAGT GGGGAT GT C AC AGAG T C C AGC C C AC C C TC C T GG TAGC AC T GAGAAGC 3375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 61 AC T GC AT GAGAGT GGGGAT GT C AC AGAG T C C AGC C C AC C C TC C T GGTAGC AC T GAGAAGC 120 

Qy 337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 34 35 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAAC C AGGC AG TGAGGC C T T GGT C TGAGAC AGT AT C C TC AGGT C AC AGAGC AGAGGATG 34 95 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 181 GGAAC CAGGCAGTGAGGCC T TGGTC TGAGACAGTAT C C TC AGGT C AC AGAGC AGAGGATG 240 

Qy 34 96 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I II I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AGGAC AC ATAGGAC T C C AC AGAG T C TGGC C T C ACC TC C C T AC T GTC AGTC C T GT AGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 C AGGAC AC ATAGGAC T C C AC AGAG T C TGGC C T C AC C TC C C T AC T GTC AGTC C T GT AGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGGAC AGGCCAACCC AGAGGACAGGAT T C CC T GGAGGC CACAGAGGAGCACC AAGGAGAA 37 35 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GGGAC AGGC C AAC C C AGAGGACAGGAT T CC C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 480 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GC C TGC T GC C C TGAC GAGAGTC AT CAT G T C TC T TGAGC AGAGGAGTC T GC AC T GC AAGC C 3915 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 601 GC C TGC T GC CC TGAC GAGAGTC AT CAT GTC TCT TGAGC AGAGGAGTC TGC AC TGC AAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I M I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I t I I I I I i I I I I I I I I I I I I I I t I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGAT CC T C C CC AGAG T C C TC AGGGAGC CTCCGCCT T TC C C AC T AC CAT C AAC T T CAC TC G 4095 

I I I II I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 781 AGAT CC T C C C C AGAG T C C T C AGGGAGC CTCCGCCTT TC C C AC T AC CAT C AAC T TC AC TC G 840 

Qy 4096 ACAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTG 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I 
Db 841 AC AGAGGCAAC CC AGTGAGGGT T C C AGC AGC C GTGAAGAGGAGGGGC C AAGC AC C T C T T G 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 T C T GCT C C T C AAAT ATC GAGC C AGGGAGCC AG T C AC AAAGGC AGAAAT GCT GGAGAGT G T 4275 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCTGCTCCT C AAAT ATC GAGC C AG GGAGCC AG T CAC AAAGGC AGAAAT GCT G GAGAGT GT 1020 

Qy 427 6 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 4455 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1141 CAC C TGC C T AGGT C T C T C C TATGATGGC C T GC T GGG T GAT AATC AGAT C AT GC C C AAGAC 1200 

Qy 4 456 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4 515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 1260 

Qy 4516 GGAAAT C TGGGAGGAGC T GAG TGT GAT G GAGG TGT AT GAT GGGAGGGAGC AC AGTGC C T A 4575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 GGAAAT C TGGGAGGAGC TGAGTGTGATGGAGGTGTATGAT GGGAGGGAGC AC AGTGC C TA 1320 

Qy 4 57 6 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4 634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACCG 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4 695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 41 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 1500 

Qy 4 755 TTTCTTCC CAT CC C T GC GT GAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGT C TGAGC AT G 4 814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 TTTCTTCC C AT CCC T GC G T GAAGC AGC T T TGAGAGAGGAGGAAGAGGG AGT C TGAGC ATG 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AGT TGCAGCCAAGGC CAGTGGGAGGGGGACTGGGCC AGTGC ACCTTCCAGGGCCGCGTCC 1620 
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Qy 4875 AGC AGC TTCCCCTGCCTCG TGT GAC ATG AGGC C CAT TC T T C AC T C T GAAGAGAGC GGT C A 4 934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AGC AGC TTCCCCTGCCTC G TG TGAC ATG AGGC C CAT TC T T C AC T C TGAAGAGAGC GGTC A 1680 

Qy 4 935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4 994 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 1860 

Qy 5115 T T TAT T C AGAT T GGGAAAT C CAT T C TAT T T T G TGAAT T GGGATAAT AAC AGC AG T G GAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T T TAT T C AGAT T GGGAAAT C C ATT C TAT T T T G T GAAT T GGGATAAT AAC AGC AG TG GAAT 1920 

Qy 517 5 AAG TAC T T AGAAATG T GAAAAATGAGCAGTAAAAT AGAT GAGATAAAG AAC T AAAGAAAT 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAG TAC T T AGAAATG T GAAAAATGAGC AGT AAAAT AGATGAGAT AAAG AAC T AAAGAAAT 1980 

Qy 5235 TAAGAGATAGTCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATAT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 T AAGAGATAGT C AAT TC TT GCC T T ATACCTCAGTCTATTC TGT AAAAT TTTT AAAG AT AT 2040 

Qy 52 95 ATGC AT AC C T GGAT T TC C T T GGC T T C T T TGAGAATG T AAGAGAAAT T AAAT C TGAAT AAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 ATGC AT AC C TGGAT T TC C T T GGC T TC T T TGAGAATG T AAGAGAAAT T AAAT C TGAAT AAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GT AGAGT C TAG GAGC T GC AGT C AC GT AATC GAGGTGGC AAGATG T C C T C T AAAG AT GT AG 5534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GT AGAGT C TAG GAGC T GC AGT C AC GT AATC GAGGTGGC AAGATG T C C T C T AAAG AT GT AG 2280 

Qy 5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 567 4 

I II II I I I I I I I I I I I I I I I 
Db 2401 TAATGATCTTGGGTGGATCC 242 0 


RESULT 6 
US-10-741-466-5 

; Sequence 5, Application US/10741466 
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Publication No. US20040180058A1 
GENERAL INFORMATION: 
APPLICANT: Sherman, M. 
APPLICANT: Shneider, A. 

TITLE OF INVENTION: Vaccine Compositions and Methods 
FILE REFERENCE: 25955-003 

CURRENT APPLICATION NUMBER: US/10/7 41,4 66 
CURRENT FILING DATE: 2003-12-19 
PRIOR APPLICATION NUMBER: 60/435,500 
PRIOR FILING DATE: 2002-12-20 
NUMBER OF SEQ ID NOS : 8 
SOFTWARE: Patentln Ver . 2.1 
SEQ ID NO 5 
LENGTH: 2 420 
TYPE: DNA 

ORGANISM: Influenza A virus 
US-10-741-466-5 

Query Match 42.4%; Score 2408; DB 9; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 3256 GGAT C C AGGC C C T GC C AGGAAAAATATAAGGGC C C T GC GT GAGAAC AGAGGGGGT C AT C C 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1 GGAT C C AGGC C C T GC C AGGAAAAATATAAGGG C CC T GC GT GAGAAC AG AGGGGG T C ATC C 60 

Qy 3316 AC T GC AT GAGAGT GGGGAT GTC AC AGAG TC C AGC CC AC C C TC C T GGT AGC AC T GAGAAGC 3375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 61 AC T GC AT GAGAGT GGGGAT GTC AC AGAG TC C AGC C C AC C C TC C T GGT AGC AC T GAGAAGC 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAAC C AGGC AGT GAGGC C T TGGT C T GAGAC AGT AT C C T C AGGT C AC AGAGC AGAGGAT G 3495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 181 GGAAC C AGGC AGTGAGGC C T TGGT C TGAGAC AGT AT C C T C AGGT C AC AGAGC AGAGGAT G 240 

Qy 34 96 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AG GAC AC AT AGGAC TC C AC AGAG T C T GGC C T C AC C T C C C T AC T GT C AGT C C T GTAGAAT 3615 

I i I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 C AGGAC AC AT AGGAC TC C AC AGAG T C TGGC C T C AC C T C C C T AC T GT C AGT C C T GTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGGAC AG GC C AAC C C AGAGGAC AGGAT T C C C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 3735 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCACAGAGGAGCACCAAGGAGAA 4 80 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 37 96 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 
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Qy 3856 GC C TGC T GC C C TGAC GAGAGTC AT C ATGT C T C T T GAGC AGAGGAGTC T GC AC TGC AAGC C 3915 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 601 GC C TGC T GC C C T GAC GAGAGT C AT C ATG T C T C T T GAGC AGAGGAGT C T GC AC T GC AAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I II I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AGATC C T C C C C AGAGT C C T C AGGGAGC CTCCGCCTT TC C C AC TAC CAT C AAC T TCAC T C G 840 

Qy 4096 AC AGAGG C AAC C C AG T GAGGGT TC C AGC AGC C GTGAAGAGGAGGGGC C AAGC AC C T C T TG 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 ACAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TC T GC T C C T C AAATATC GAGC C AGGGAGC C AG T C AC AAAGGC AGAAAT GC T GGAGAGT GT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TC TGC TCCTCAAATATCGAGCCAGGGAGCCAGTC AC AAAGGC AG AAATGCTGGAGAGTGT 1020 

Qy 4276 CAT C AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC C T C TGAGT C C T T GC A 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CAT C AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC C T C TGAGT C C T T GC A 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 4455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 1200 

Qy 4 4 56 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4 515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 12 60 

Qy 4516 GGAAAT C T GGGAGGAGC TGAGT GT GAT GGAGG T GTAT GAT GGGAGGGAGCAC AGT GC C TA 4575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GGAAAT C T GGGAGGAGC TGAGT GT GAT GGAGG TGT AT GAT GGGAGGGAGCAC AGT GC C TA 1320 

Qy 457 6 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4 634 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
Db 1321 T GG GGAGC C C AGGAAGC T GC T C AC C C AAGAT T T GG T GC AGGAAAAGTACC T GGAGT AC C G 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4 695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4 7 54 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 41 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 1500 
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Qy 4755 TTTCTTCC CAT C C C T GCGT GAAGC AGC T T T GAGAGAGGAGGAAGAGGG AGT C TGAG C ATG 4814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I M I I I I I I I I 
Db 1501 TTTCTTCC CAT C CC T GCGT GAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGTC TGAGC ATG 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 4934 

I I M II I M I I I I I I I I II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I 
Db 1621 AGC AGC TTCCCCTGCCTC G TGTGAC AT G AGGC C CAT TC T TC ACT C TGAAGAGAGC GGTCA 1680 

Qy 4935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4994 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4 995 T T T GGAAT TGT T C AAATGT TT T T T T T T AAGGGATGG TT GAAT GAAC T T C AGC AT C C AAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1741 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 1800 

Qy 5055 T TAT GAATGAC AGC AG TC AC AC AG T T C T GT GT ATAT AG T T T AAG GGT AAGAG TCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 1860 

Qy 5115 T T TAT T C AGAT T GGGAAAT CC AT T C TAT T T TG T GAAT T GGGATAATAAC AGC AGT GGAAT 5174 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 1861 T T TAT T C AGAT TGGGAAAT CC AT T C TAT T T T G T GAAT TGGGATAATAAC AGC AGT GGAAT 1920 

Qy 5175 AAG T AC T T AGAAAT G T GAAAAAT G AGC AGT AAAAT AG AT G AGAT AAAG AAC T AAAG AAAT 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAGTAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGAT AAAGAAC T AAAGAAAT 1980 

Qy 5235 T AAGAG AT AGT C AAT T C T T GC C TT ATAC C TC AGT C TAT T C T GT AAAAT T T T T AAAG AT AT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I 
Db 1981 T AAGAGAT AGT C AAT TC T T GC C T T ATAC C TC AGT C TAT T C T GT AAAAT T T T T AAAG AT AT 2040 

Qy 5295 AT GC AT AC C T GGAT TTCCTTGGCTTCTTT GAG AAT G TAAGAGAAAT T AAAT C TGAAT AAA 5354 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 AT GC AT AC C T GGAT T T C C T TGGC T T C T T TGAG AAT G TAAGAGAAAT T AAAT C T GAAT AAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GT AGAGT C T AGGAGC TGC AGT C AC GT AAT C GAGGT GGC AAGATG T CC T C T AAAGAT GTAG 5534 

I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2221 G T AGAGT C TAG GAGC T GC AGTC AC GTAATC GAGGTG GC AAGAT G TCC T C T AAAGAT GTAG 2280 

Qy 5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I 
Db 2281 GGAAAAG TGAG AGAGGGGT GAGGG T GTG GGGC TC C G GGTG AGAG T GG T GGAG T GTC AAT G 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2341 CCC TGAGC TGGGGCATTTTGGGCTTTGGGAAACTGC AGT TCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 567 4 
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1 1 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2401 TAATGATCTTGGGTGGATCC 2420 


RESULT 7 

US-10-657-022-81 

Sequence 81, Application US/10657022 
Publication No. US20040180354A1 
GENERAL INFORMATION: 
APPLICANT: Simard, John J. L. 
APPLICANT: Diamond, David C. 
APPLICANT: Liu, Liping 
APPLICANT: Liu, Zheng 

TITLE OF INVENTION: EPITOPE SEQUENCES 
FILE REFERENCE: MANNK.032A 

CURRENT APPLICATION NUMBER: US/10/657,022 
CURRENT FILING DATE: 2003-09-04 
PRIOR APPLICATION NUMBER: 60/409123 
PRIOR FILING DATE: 2002-09-06 
NUMBER OF SEQ ID NOS : 610 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 81 
LENGTH: 2 420 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-657-022-81 

Query Match 42.4%; Score 2408; DB 9; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 325 6 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II 
Db 1 GG AT C C AGGC C C T GC C AGG AAAAAT AT AAGGGC C C T GC GT GAGAAC AG AGGG GG TC AT C C 60 

Qy 3316 AC TGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCC TCC TGGTAGCAC TGAGAAGC 3375 

I I I I I I I I I I I MM I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AC T GC AT GAGAGTGGGGAT GTC AC AGAG TC C AGC C C AC CC TCC T GGT AGC AC T GAGAAGC 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I M II M II II II I I M M M M I I II I M II M M M M I II I II M II I I I I I M I II 

Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAACCAGGCAGTGAGGCC T TGGTC TGAGACAGTATCC TC AGGT CACAGAGC AGAGGATG 3495 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 181 GGAAC C AGGC AG TGAGGC C T T GGT C TGAGAC AGT AT C C TC AGG T C AC AGAGC AGAGGAT G 240 

Qy 3496 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AG GAC AC AT AGGAC TC C AC AGAG T C T GGC C T C AC C T C C C T AC T G T C AG T C C T G T AGAAT 3615 

I I I I I I I I II I I I I I II I I I I I I I I I I I I II I I I II I II 1 I I I I I I II I I I I I I I I II I I 
Db 301 C AGGAC AC AT AGGAC TC C AC AGAG TCTGGCCT C AC C T C CC T AC T G T C AGT C C T GTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGGACAGGCCAACCC AGAGGACAGGATTCCC T GGAGGCCAC AGAGGAGCACC AAGGAGAA 3735 

II I I M I I I II I I I I I I I I I I || I II II II II I I II I I I I || I | | | | | || | | || || | | || 
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Db 421 GGGACAGGCCAACCC AGAGGACAGGAT T CCC TGGAGGCCACAGAGGAGCACC AAGGAGAA 480 

Qy 3736 GATC TGT AAGT AGGC C T T T G T TAG AGT C TC C AAGGT T C AG T T C T C AGC T GAGGC C T C TC A 3795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I II I I I I I I I II E I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GCC TGC T GC C C T GAC GAGAGTC AT CAT G TC T C T TGAGC AGAGGAGTC T GC AC TGC AAGC C 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GC C TGC T GC C C TGAC GAGAGTC AT C AT GTC T C T T GAGC AGAGGAGT C T GC AC T GCAAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 397 6 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGAT C C T C C C C AGAG T CC T C AGGGAGC CTCCGCCTTTC C C AC TAC C AT C AAC T T C AC TC G 4095 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 840 

Qy 4096 AC AGAGGC AAC C C AG T GAGGGT TC C AGC AGC C GT GAAGAGGAGGGGC C AAGC AC C T C T T G 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 AC AGAGGC AAC C C AG T GAGGGT TC C AGC AGC C GT GAAGAGGAGGGGC C AAGC AC C T C T TG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 1080 

Qy 4336 GC T GGT C T T T GGC AT TGAC GT GAAGGAAGC AGAC C C C AC C GGC C AC T C C T ATGT CC T TGT 4395 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 GC T GGT C T T T GGC AT TGAC GT GAAGGAAGC AG ACC C C AC C GGC C AC T C C T ATGT C C T TG T 1140 

Qy 4 396 C ACC TGC CTAGGTCTCTCCTATGATGGCC TGC TGGGTGATAATC AGAT CATGCCCAAGAC 44 55 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 C ACC TGC CTAGGTCTCTCCTATGATGGCC TGC TGGGTGATAATC AGAT CATGCCCAAGAC 1200 

Qy 4456 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 1260 

Qy 4516 GGAAATC TGGGAGGAGC TGAGTGT GATGGAGGT GTAT GAT GGGAGGGAGCAC AGTG C C T A 4575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GGAAATC TGGGAGGAGC TGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTA 1320 

Qy 4 57 6 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4 634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I II 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACCG 1380 
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Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4 695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

I I M I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II 
Db 1441 TGAAAC C AGC T ATGT GAAAGT CC T T GAG TAT G T GAT C AAGG TC AGTGC AAGAGT T C GC T T 1500 

Qy 4755 TT T C TTC CCAT CCC T GCGTGAAGC AGCT TTGAGAGAGGAGGAAGAGGGAGTC TGAGCATG 4814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 TTTC T TC CCAT CCC T GCGTGAAGC AGCT T TGAGAGAGGAGGAAGAGGGAGTC TGAGCATG 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 4934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I 1 I I I I I I I I I I I I I 
Db 1621 AGC AGC TTCCCCTGCCTCG T GT GACAT GAGGC C C AT TC T T C AC T C T GAAGAGAGC GGT C A 1680 

Qy 4935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4994 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4 995 T T T GGAAT T G T TC AAATGT t T T T T T T T AAGGGATGG T TGAAT GAAC T T C AGC AT C C AAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 
Db 1741 T T T GGAAT T G T TC AAAT GT t T T T T T T T AAGGGATGG T TGAAT GAAC T T C AGC AT C C AAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 1860 

Qy 5115 T T T AT T C AGAT TGGGAAAT CC AT T C TAT T T TG TGAAT TGGGAT AATAAC AGC AG TG GAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 TTT AT TC AGAT TGGGAAAT CCAT TC TAT T T TG TGAAT TGGGAT AATAAC AGC AGT GGAAT 1920 

Qy 5175 AAG T AC T T AGAAAT G T GAAAAAT G AGC AG TAAAAT AGAT G AGAT AAAGAAC T AAAG AAAT 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAGT AC T T AGAAAT G T GAAAAAT G AGC AGT AAAAT AG ATG AG AT AAAG AAC T AAAG AAAT 1980 

Qy 5235 T AAGAGAT AGT C AAT T C T T GC C T TAT AC C TC AGTC T AT TC T GTAAAAT TTT T AAAG AT AT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 TAAGAGAT AGT C AAT T C T T GC C T TAT AC C TC AGTC T AT TC T G TAAAAT TTT T AAAG AT AT 2040 

Qy 5295 ATG CAT AC C T GGAT T T C C T TGGC T TC T T TGAGAAT G T AAG AGAAAT TAAAT C TGAAT AAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 AT GC AT AC C TG GAT T TC C T TGGC T TC T T T GAG AAT G T AAG AGAAAT TAAAT C TGAAT AAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 54 74 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAG 5534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GT AGAG T C T AGGAGC T GC AGT C AC GTAATC GAGGT GGC AAGAT G TC C T C T AAAGATGT AG 2280 
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Qy 5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2281 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 5674 

I II I I I I I I I I II I I 1 I I I I 
Db 2401 TAATGATCTTGGGTGGATCC 2420 


RESULT 8 

US-10-807-308-17 

Sequence 17, Application US/10807308 
Publication No. US20040241725A1 
GENERAL INFORMATION: 
APPLICANT: Xiao, Wenming 
APPLICANT: Dong, Gang 

TITLE OF INVENTION: LUNG CANCER DETECTION 
FILE REFERENCE: 114122-00153 
CURRENT APPLICATION NUMBER: US/10/8 07,308 
CURRENT FILING DATE: 2004-03-24 
NUMBER OF SEQ ID NOS : 40 
SOFTWARE: Patentln version 3.1 
SEQ ID NO 17 
LENGTH: 2 420 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-807-308-17 

Query Match 42.4%; Score 2408; DB 9; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 3256 GGAT C C AGGC C C T GC C AGG AAAAATATAAGGG CC C T GC GT GAGAAC AGAGGGGGTC AT C C 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 60 

Qy 3316 AC T GC ATGAGAGT GGGGAT GT CAC AGAG T C C AGC C C AC C C T C C T GG T AGC AC T GAGAAGC 3375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AC T GC ATGAGAGT GGGGAT GTCAC AGAG T C C AGC C C AC C C T C C T GG T AGC AC T GAGAAGC 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 34 36 GGAAC C AGGC AGT GAGGC C T T GGT C TGAGAC AGTAT C C TC AGGT C AC AGAGC AGAGGATG 34 95 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAAC C AGGC AGT GAGGC C T T GGT C TGAGAC AGTAT C C T C AGGT CAC AGAGC AGAGGATG 240 

Qy 3496 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 CAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 
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1 1 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 367 6 GGGAC AGGC C AAC C C AGAGGAC AGGAT T C C C T GGAGGCC AC AGAGGAGC ACC AAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 421 GGGAC AGGC C AAC C C AGAG GAC AGGAT T C C C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 480 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II II I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GC C TGC T GC C C T GAC GAGAGTC AT CAT G TC T C T TGAGCAG AGGAG T CT GC AC TGC AAGC C 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCC 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATC C T CC C C AGAG TC C T C AGGGAGC CTCCGCCTTTC C C AC TAC CAT C AAC T T C AC TC G 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AGATC C T CC C C AGAG TC C T C AGGGAGC CTCCGCCTT TC CC AC TAC CAT C AAC T T C AC TC G 840 

Qy 4096 AC AGAGGC AAC C C AG T GAGGGT T C C AGC AGC C GT GAAGAGGAGG GGCC AAGC AC C T C T T G 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AC AGAGGC AAC C C AG T GAGGGT T C C AGC AGC C GT GAAGAGGAGG GGCC AAGC AC C T C T T G 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CAT C AAAAAT TAC AAGC AC TGT T T TCC T GAGAT C T T CGGC AAAGC C TC T GAG T C C T TGC A 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GC T GG TC T T T GGC AT TGAC GTGAAGGAAGC AG AC C C C ACC GGC C AC TCC T AT GT C C T T G T 1140 

Qy 4396 C AC C TGC C T AGGT C T C TC C TATGAT GGC C T GC T GGG T GAT AATC AGAT C ATGC C C AAGAC 4455 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 C AC C T GC C T AG GTC T C T C C TATGAT GGC C T GC T GGG T GAT AAT C AGAT CAT G C C C AAGAC 1200 

Qy 4456 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 1260 

Qy 4516 GGAAATC TGGGAGGAGC TGAGTGT GATGGAGGTGTATGAT GGGAGGGAGCAC AGTGC C TA 4575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
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Db 1261 GGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTA 1320 

Qy 457 6 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4 634 

I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACCG 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4694 

I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1441 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 1500 

Qy 4755 TTTCTTCC CAT C CC T GC G T GAAGC AGC T TTGAGAGAGGAGGAAGAGGGAG TC TGAGC ATG 4814 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 TTTCTTCC CAT C CC T GC G T GAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGTC TGAGC ATG 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 4934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AGC AGC TTCCCCTGCCTCG T GT GAC ATGAGGC C CAT T C T T C AC T C T GAAGAGAGCG GT C A 1680 

Qy 4935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4994 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4 995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 T T T GGAAT T GT T C AAATG T t T T T T T T T AAGGGAT GG T T GAATGAAC T T C AGC AT CC AAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I 
Db 1801 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 1860 

Qy . 5115 T T TAT TC AGAT T GGGAAAT C CAT T C TAT T T TG T GAAT TGG GAT AAT AAC AGC AGTG GAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I j II I I I I I I I 
Db 1861 T T TAT TC AGAT T GGGAAAT C CAT T C TAT T T TG T GAAT TGGGAT AAT AAC AGC AGTGGAAT 1920 

Qy 5175 AAG T AC T T AGAAAT G TGAAAAAT GAGCAGTAAAATAGATG AGAT AAAG AAC T AAAGAAAT 5234 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921. AAGTAC T TAGAAATGTGAAAAATGAGC AGTAAAATAGATGAGAT AAAGAAC T AAAGAAAT 1980 

Qy 5235 TAAGAGATAGT CAAT TC T T GCC T T ATAC CTCAGTC T AT TC TGTAAAAT T T T T AAAGATAT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 TAAGAGATAGT C AAT TC T T GC C T TAT AC C TC AG T C TAT T C T GTAAAAT T T T T AAAGATAT 2040 

Qy 5295 AT G C AT ACC T GGAT T TC C T TGGC T T C T T TGAG AAT G T AAG AGAAAT TAAAT C T GAAT AAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I 
Db 2041 AT GC AT AC C TGGAT T TC C T TGGC T TC T T TGAG AATG T AAG AGAAAT TAAAT C TGAATAAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 


5475 GT AGAGT C T AGGAGC T GC AGT C AC GTAATCGAGGTGGC AAGAT G TCC T C T AAAGAT GT AG 5534 

I I I I I I I I I I I I I I 1 I I I I II I I I I I I I I I II I I I t I I I I I I I I I I I I I I I I I I I I I I I I 
2221 GT AGAG T C T AGGAGC TGC AGT C AC GTAATC GAGGTGGC AAGAT G T C C T C T AAAGAT GT AG 2280 

5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 2340 

5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I 
2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

5655 TAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I M I I I I I I I I I 

2401 TAATGATCTTGGGTGGATCC 242 0 


RESULT 9 
US-10-866-484 
Sequence 5, 


-5 
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Query Match 42.4%; Score 2408; DB 9; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; 


Gaps 


1; 


Qy 


Db 


3256 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1 GG AT C C AGGC C C T GC C AGG AAAAAT AT AAGGG C C C T GC GT GAGAAC AG AGGG GGT C AT C C 60 


Qy 


Db 


3316 AC T GC AT GAGAGT GGGGAT GT CAC AGAG TC C AGC CC AC CC T C C T GGT AGC AC TGAGAAGC 3375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 AC T GC AT GAGAGTGGGGAT GT CAC AGAG TC C AGC CC AC C C TC C T GGT AGC AC T GAGAAGC 120 


Qy 

Db 

Qy 

Db 


337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I II I I II I I I I I I I I I I I I I I I I I I I 
CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 


121 


180 


34 36 GGAAC C AGGC AGT GAGGC C T TGGT C TGAGAC AGT AT C C TC AGGT C AC AGAGC AGAGGAT G 3495 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 GGAAC C AGGC AGTGAGGC C TT GGT C TGAGAC AGT AT C C T C AGGT CAC AGAGC AGAG GAT G 240 
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Qy 3496 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 CAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAAT 3 60 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 II I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 367 6 GGGAC AGGCC AAC CC AGAGGAC AGGAT T CC C T GGAGGC C AC AGAGGAGC ACC AAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 421 GGGAC AGGC CAAC C C AGAGGACAG GAT T C C C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 480 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 37 95 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I II I I I I I I I I I I I II I I I 
Db 481 GAT C T GT AAGT AGGC C T T T GT TAGAGT C TC C AAGG T T C AG T T C T C AGC TGAGGC C T C T C A 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GC C T GC T GC C C T GAC GAGAGT C AT C ATG T C TC T T GAGC AGAGGAGTC T GC AC TGC AAGC C 3915 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GCC TGC TGCCCTGACGAGAGTC AT C ATG TCTCTTGAGC AGAGGAGTC TGC AC TGC AAGCC 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 781 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 84 0 

Qy 4096 AC AGAGGC AAC C C AG TGAGGGT TC C AGC AGC C GTGAAGAGGAGGGGC C AAGC ACC T C T T G 4155 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AC AGAGGC AAC C C AG TGAGGGT TC C AGC AGC C GT GAAGAGGAGGGGC C AAGC AC C T C T T G 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 C AC C TGC C TAG GTCTCTCC T ATGAT GGC C T GC T GGG T GAT AAT C AGAT C ATGC C C AAGAC 4455 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1141 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 1200 

Qy 4456 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 1260 

Qy 4516 GGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTA 4575 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 GGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTA 1320 

Qy 4576 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IE 
Db 1321 TGGGGAGC C C AGGAAGC TGC T C AC C C AAGAT T T GG T GC AGGAAAAGTAC C T GGAGT AC C G 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I MM I ! I I I I I 

Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

M M I M I M I I I I M II I M I I I I M I II M I I I M I M I 1 I I M M I II II I I M I I I 

Db 14 41 T GAAAC C AGC T AT GT GAAAGT C C T TGAG TAT G TGAT C AAGGT C AGT GC AAGAG T T C GC T T 1500 

Qy 4755 TTTCTTCC CAT C C C T GC GT GAAGC AGC T T T GAGAGAGGAGGAAGAGGG AGT C TGAGC AT G 4814 

I I II I I II II I I I I I I I I II I I I II I I II I I I I I I I I I I II I I M I I I I I I I I I I I I I I I 
Db 1501 TTTCTTCC CAT C C C T GC GT GAAGC AGC T T T GAGAGAGGAGGAAG AGGGAGT C TGAGC AT G 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I II I I I E I I I I I I II I I I I I I I II I I I I I I II I I I I I II I I I I II II I I M I I I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGC AGC TTCCCCTGCCTCGTGT GAC AT GAGGC CC AT T C T T C AC T C TGAAGAGAGC G GT C A 4934 

I I I I I I I I II I I I I I I I I II I I I I I I I I I I I E I I I I I II II I I I I I I I I E I I I I I II I I I 
Db 1621 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 1680 

Qy 4 935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4 9 94 

I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I IE I I I I I I I I I I I II I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I II I I I II I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I t I I I I I I I II I I I I I I I 
Db 1741 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I II I I I I I I 
Db 1801 T TAT GAAT GAC AGC AGTC AC AC AG T T C T GT GT AT AT AGT T TAAGGG T AAGAG T C T T GT GT 1860 

Qy 5115 T T T AT TC AGAT TGGGAAAT C CAT T C TAT T T T G TGAAT T GG GATAAT AAC AGC AGT GGAAT 5174 

I I I I I I II I II I I I I I I I I E I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 
Db 1861 TT TAT TCAGATTGGGAAATCCATTCTATTTTG TGAAT TGGGATAATAACAGCAGTGGAAT 1920 

Qy 5175 AAG T AC T T AGAAAT G TGAAAAATGAGC AGT AAAAT AGAT GAGAT AAAGAAC T AAAGAAAT 5234 

I I II I II I I I I I I II I I I I I I I I I I I I I I I I ! I I I M I II I I I I I I I II I II II I I I I I I 
Db 1921 AAG TACTTAGAAATG TGAAAAATGAGC AGT AAAAT AGAT GAGAT AAAGAAC TAAAGAAAT 1980 

Qy 5235 TAAGAGAT AG T C AAT TC T T GC C T TAT AC C T C AGTC TAT T C T GT AAAAT T T T T AAAG ATAT 52 94 

I E I I I E II I II II I I I I I I I I E I I I I I II I I I I I II I I II I I I I I I E I I I II II I I II I I 
Db 1981 TAAGAGAT AG T C AAT TC T T GC C T TAT AC C T C AGT C TAT T C T GT AAAAT T T T T AAAG AT AT 2040 

Qy 5295 AT GC AT AC C T GGAT T TC C T TGGC T T CT T T GAG AAT G TAAG AGAAAT T AAAT C T GAAT AAA 5354 

I I M II M I I I I t I I I II I I I I I I I I I I I I I I I I I I I I I I II II I || || I I II I I I I I I I 
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Db 2041 ATGC AT AC C TGGAT T T CC T T GGC T TC T T TGAGAATG T AAGAGAAAT T AAATC T GAATAAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I M I I I I I I I I t I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAG 5534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GT AGAGT C T AGGAGC T GC AGT C AC GT AAT C GAGGTGGC AAGAT G T C C T C T AAAGAT GT AG 2280 

Qy 5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGAAAAG TGAGAGAGGGG T GAGGG TGTGGGGC T C C G GGT GAGAG T GGT GGAGT GTC AATG 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I 
Db 2401 TAATGATCTTGGGTGGATCC 2420 
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Qy 3256 GGAT C C AGGC C C T GC C AGG AAAAAT AT AAGGGC C C T GC G T GAGAAC AG AGGGGGT C AT C C 3315 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGT GAGAAC AG AGGGGGTCATCC 60 

Qy 3316 AC T GC AT GAGAGTGG GGAT G TC AC AGAG TC C AGC C C AC C C T C C T GGTAGC AC T GAGAAGC 3375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 61 AC T GC AT GAGAGTGG GGAT G T C AC AGAG T C C AGC C C AC C C T C C T GGT AGC AC TGAGAAGC 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 
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Qy 3436 GGAAC C AGGC AG T GAGGCC T T GGT C TGAGAC AGT AT C C TC AGGT C AC AGAGC AGAGGATG 34 95 

I I I I I I II I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I 
Db 181 GGAAC C AGGC AGT GAGGCC T T GGT C T GAGAC AGT AT C C TC AGGT C AC AGAGC AGAGGATG 24 0 

Qy 3496 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 CAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 301 C AGGAC AC AT AGGAC TC C AC AGAG TC TGGCCTCACCTCCC T AC T GTC AGTC C TGTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 367 6 GGGACAGGCCAACCC AGAGGACAGGATT CCC T GGAGGCCACAGAGGAGCACC AAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GGGACAGGCCAACC CAGAGGACAGGAT TCCC TGGAGGCCACAGAGGAGCACC AAGGAGAA 480 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCC 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GC C TGC T GC CC TGAC GAG AGT CAT C ATG T C T C T T GAGCAG AGGAGT C T GC AC TGC AAGCC 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 397 6 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATC C T C C C C AGAGT CC T C AGGGAGCC TCCGCCTT TC C C AC T ACC AT CAAC T TC AC T CG 4095 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 AGATCCTCCCCAGAGTCCTCAGGGAGCC TCCGCCTT TCCCACTACCATCAACTTCACTCG 840 

Qy 4096 ACAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTG 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 ACAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TC TGC TCCTCAAATATCGAGCC AGGGAGCC AGTC AC AAAGGC AG AAATGCTGGAGAGTGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCTGCTCCTCAAATATCGAGCC AGGGAGCC AGTC AC AAAGGC AG AAATGCTGGAGAGTGT 1020 

Qy 4276 CAT C AAAAAT T AC AAGC AC TGTTTTCCT GAGATC T T CGGC AAAGC C T C T GAG T C C T T GC A 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I 
Db 1021 CAT C AAAAAT T AC AAGC AC TGTTTTCCT GAGATC T T CGGC AAAGC C T C T GAG T C C T T GC A 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 

Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 4 455 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 1200 

Qy 4 4 56 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4 515 

I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 1260 

Qy 4516 GGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTA 4575 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 GGAAAT C T GGGAGGAGC TG AG T GT GAT G GAGG TGTAT GATGGGAGGGAGC AC AGTGCC TA 1320 

Qy 4576 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4 634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACCG 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 41 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 1500 

Qy 4755 T T T C TTC CC AT CCC T GCGTGAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGTC TGAGCATG 4 814 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1501 T T TC TTC CCAT CCC T GCGTGAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGTC TGAGCATG 1560 

Qy 4 815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 487 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGC AGC TTCCCCTGCCT C GT GTGAC ATGAGGC C C AT TC T T C AC T C T GAAGAGAGC G GT C A 4934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AGC AGC TTCCCCTGCCT C GT GTGAC ATGAGGC C CAT TC T T C AC T C TGAAGAGAGC G GT C A 1680 

Qy 4935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4994 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4 995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 1860 

Qy 5115 T T T AT TC AGAT TGGGAAAT C CAT T C TAT T T T G T GAAT T GGGAT AAT AAC AGC AGT G GAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T T T AT TC AGAT TGGGAAAT C CAT T C TAT T T T G T GAAT T GGGAT AAT AAC AGC AGT GGAAT 1920 

Qy 5175 AAGTACT TAGAAATGTGAAAAATGAGC AGTAAAATAGATGAGAT AAAGAAC T AAAGAAAT 5234 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1921 AAG T AC T T AGAAAT G TGAAAAATG AGC AGT AAAATAGATGAGAT AAAGAAC T AAAGAAAT 1980 

Qy 5235 TAAGAGATAGTCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATAT 5294 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
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Db 1981 TAAGAGATAGTCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATAT 2040 

Qy 5295 AT GCAT ACC T GGAT T TC C T TGGC T T C T T TGAG AATG TAAGAGAAAT T AAAT C TGAATAAA 5354 

I I I I I I f I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 AT GCAT ACC T GGAT T TC C T TGGC T T C T T TGAG AATG TAAGAGAAAT T AAATC T GAAT AAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I E I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAG 5534 

I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I 
Db 2221 GTAGAGT C TAGGAGC TGC AGTC AC G T AATC GAGGT G GC AAGATG T C C T C TAAAGAT GT AG 2280 

Qy 5535 GGAAAAGT GAG AGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTC AATG 5594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I 
Db 2401 TAATGATCTTGGGTGGATCC 2420 


RESULT 11 
US-10-871-708-14 

; Sequence 14, Application US/10871708 

; Publication No. US20050118186A1 

; GENERAL INFORMATION: 

; APPLICANT: Chiang, Chih-Sheng 

; TITLE OF INVENTION: COMBINATIONS OF TUMOR-ASSOCIATED 

; TITLE OF INVENTION: ANTIGENS IN COMPOSITIONS FOR VARIOUS TYPES OF CANCERS 
; FILE REFERENCE: MANNK . 0 3 5 A 

; CURRENT APPLICATION NUMBER: US/10/871,708 

; CURRENT FILING DATE: 2004-06-17 

; PRIOR APPLICATION NUMBER: 60/479,554 

; PRIOR FILING DATE: 2003-06-17 

; NUMBER OF SEQ ID NOS : 18 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 14 

LENGTH: 2 420 

TYPE: DNA 

; ORGANISM: Human antigen (MAGE-1) gene, complete cds 
US-10-871-708-14 

Query Match 42.4%; Score 2408; DB 10; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 3256 GGAT C C AGGCC C T GC C AGGAAAAAT ATAAGGGC C C T GC GT GAGAAC AGAGGG GG TC ATC C 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 60 

Qy 3316 ACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTGGTAGCACTGAGAAGC 3375 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 AC T GC AT GAGAGTGGGGAT GTC AC AGAG T C C AGC C C AC C C TCC T GGT AGC AC T GAGAAGC 120 

Qy 337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 34 35 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I II I I ! I 1 I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAACCAGGCAGTGAGGCC T TGGT C TGAGACAGTATCC TC AGGTCAC AGAGC AGAGGATG 34 95 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAACCAGGC AGTGAGGCC T TGGT C TGAGACAGTATCC TCAGGT C AC AGAGC AGAGGATG 240 

Qy 34 96 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AG GAC AC AT AGGAC T C C AC AGAG TC TGGCC T C AC C T C CC TAC T GT C AGT C C TGT AGAAT 3615 

I I I I I II I I 1 I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I II I I I I I I II I I I I I I 
Db 301 CAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 367 6 GGG AC AGGC C AACC C AGAGGACAGGAT T C C C T GGAGGC C AC AGAGGAG C AC C AAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 421 GGGAC AGGC C AACC C AGAGGAC AG GAT T CC C T GGAG GC C AC AGAGGAGC AC C AAGGAGAA 4 80 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GCCTGCTGCCC TGAC GAGAGT C AT C AT G TC TC T T GAGC AGAGGAG T C T GC AC TGC AAGC C 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GC C T GC T GC C C TGAC GAGAGT CAT CAT G TC TC T T GAGC AGAGGAG T C T GC AC TGC AAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 
Db 781 AGAT CC T C C C C AGAG T C C T C AGGGAGC CTCCGCCTTT C CC AC TAC CAT C AAC T TC AC T CG 840 

Qy 4 096 AC AG AGGC AAC C C AGT GAGG GT T C C AGC AGCC G TGAAGAGGAGGGGC C AAGC AC C TC T T G 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AC AGAGG C AAC C C AG TGAGGGT T C C AGC AGCC GT GAAGAGGAGGGGC C AAGC AC C T C T T G 900 

Qy 4156 TAT CCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATT TGGT TGGT TT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 T C T GC T C C T C AAATATC GAGC C AGGGAGC C AG T C AC AAAG GC AG AAAT GC T G GAGAGT GT 427 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
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Db 961 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I 
Db 1021 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 4455 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 1200 

Qy 44 56 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I M f I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 1260 

Qy 4516 GGAAAT C T GGGAGGAGC T GAGT GT GATGGAGG TGT AT GAT GGGAGGGAGC AC AG TG C C T A 4575 

I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 GGAAAT C T GGGAGGAGC TGAGTGT GAT GGAGG TGT AT GAT GGGAGGGAGC AC AGTGC C T A 1320 

Qy 4 57 6 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4 634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACCG 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4 695 T GAAAC C AGC T ATGT GAAAGTC C T T GAG TAT G TGAT CAAGGT C AGTGC AAGAG T T C GC T T 4754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TGAAACC AGC T ATGT GAAAGTCCTTGAGTATG TGAT CAAGGTCAGTGCAAGAGTTCGCTT 1500 

Qy 4755 TTTCTTCC CAT C CC T GC GT GAAGC AGC T T T GAGAGAGGAG GAAGAGGG AGTC T GAGC AT G 4814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 TTTCTTCC CAT C CC T GC GT GAAGC AGC T T T GAGAGAGGAG GAAGAGGGAGT C T GAG CAT G 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 4934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 1680 

Qy 4 935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4 994 

I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4 995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1741 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I 
Db 1801 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 18 60 

Qy 5115 T T T ATT C AGAT TGGGAAAT C CAT T C TAT T T TG T GAAT T GGGATAAT AAC AGC AGTGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T T T ATT C AGAT TGGGAAAT C C AT T C TAT T T TG T GAAT T GGGATAATAAC AGC AGTGGAAT 1920 
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Qy 5175 AAG TAC T T AGAAATG T GAAAAATGAGC AGT AAAATAGATGAGAT AAAGAAC T AAAG AAAT 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAG TAC T TAGAAATGT GAAAAATGAGC AG TAAAATAGATGAGAT AAAGAAC T AAAG AAAT 1980 

Qy 5235 TAAGAGATAGTCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATAT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 T AAGAGAT AG T C AAT TC T T GC C T TAT AC C T C AGTC T AT TC T GT AAAAT T T T T AAAG AT AT 2040 

Qy 5295 ATGC AT AC C TGGAT T TC C T TGGC T TC T T TGAGAATG T AAGAGAAAT T AAAT C T GAATAAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2041 ATGC AT AC C T GGAT T TC C T TGGC T TCTTTGAGAATGT AAG AGAAATTAAATCT GAATAAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I E I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GT AGAGT C TAG GAGC T GC AGT C AC GTAAT C GAGGT GGC AAGAT GTC C T C T AAAGAT G TAG 5534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I M I I I I I I I I I I I 

Db 2221 GTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAG 2280 

Qy 5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 5674 

I I I I I I I I II I I I I I I I I I I 
Db 2401 TAATGATCTTGGGTGGATCC 2420 


RESULT 12 
US-11-067-064-81 

; Sequence 81, Application US/11067064 

; Publication No. US20050142144A1 

; GENERAL INFORMATION: 

; APPLICANT: SIMARD, John, J.L. 

; APPLICANT: DIAMOND, David, C. 

; APPLICANT: LIU, Zheng 

; TITLE OF INVENTION: EPITOPE SEQUENCES 

; FILE REFERENCE: MANNK. 027C2 

; CURRENT APPLICATION NUMBER: US/11/0 67,0 64 

; CURRENT FILING DATE: 2005-02-25 

; PRIOR APPLICATION NUMBER: US 60/282,211 

; PRIOR FILING DATE: 2001-04-06 

; PRIOR APPLICATION NUMBER: US 60/337,017 

; PRIOR FILING DATE: 2001-11-07 

; PRIOR APPLICATION NUMBER: US 60/363,210 

; PRIOR FILING DATE: 2002-03-07 

; PRIOR APPLICATION NUMBER: US 10/117937 

; PRIOR FILING DATE: 2002-04-04 

; NUMBER OF SEQ ID NOS : 602 

SOFTWARE: FastSEQ for Windows Version 4.0 

; SEQ ID NO 81 
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LENGTH: 2420 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-11-067-064-81 

Query Match 42.4%; Score 2408; DB 13; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 


Qy 3256 GGATC C AGGC C C T GC C AGGAAAAATAT AAGGGC C C T GC GT GAGAAC AGAGGGGGT C ATC C 3315 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 

Db 1 GGATC C AGGC C C T GC C AGGAAAAATAT AAGGGC C C T GC GT GAGAACAGAGGGGGTC ATCC 60 

Qy 3316 AC T GC AT GAGAGT GGGGAT GTC AC AGAG TCC AGC CC AC C C T C C T GGTAGC AC T GAGAAGC 3375 

I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 AC T GC AT GAGAGT GGGGAT GTC AC AGAG TC C AGC CC AC C C T C C T GGTAGC AC T GAGAAGC 120 

Qy 337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I II I II I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I 

Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAAC C AGGC AGT GAGGC C T TGGT C TGAGAC AGT AT C C T C AGGT C AC AGAGC AGAGGAT G 3495 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 

Db 181 GGAAC C AGGC AGTGAGGC C TT GGT C TGAGAC AG TAT C C T C AGGT C AC AGAGC AGAG GAT G 240 

Qy 3496 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AGGAC ACAT AGGAC T CC AC AGAG TC TG GC C T C AC C T CC C TAC T GT C AGT C C TGT AGAAT 3615 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C AGGAC AC AT AGGAC T CC AC AGAG TC TG GC C T C ACC TCC C TAC T GT C AGTC C T GT AGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGGAC AGGC C AAC C C AGAG GAC AGGAT T C C C TGGAGGCC AC AGAGGAGC AC C AAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GGGACAGGCCAACCC AGAGGACAGGAT TCCC TGGAGGCCACAGAGGAGCACC AAGGAGAA 4 80 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GCCTGCTGCCCT GAC GAGAGTC AT C ATG TC T C T TGAGC AGAGGAGT C T GC AC TGC AAGCC 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 GCCTGCTGCCC TGAC GAGAGTC AT C ATG TC T C T TGAGC AG AGGAGTC T GC AC TGC AAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 
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Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 

Db 781 AGATC C T C C CC AGAG T C C T C AGGGAGC CTCCGCCTT TC C C AC T AC CAT C AAC TTC AC T CG 840 

Qy 4096 AC AGAGGC AAC C C AG T GAGGGT TC C AGC AGC C GT GAAGAGGAGGGGC C AAGC AC C TC T TG 4155 

I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 ACAGAGGCAAC CCAGTGAGGGT TC CAGC AGCC GTGAAGAGGAGGGGCC AAGC ACC TC T TG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I 

Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TC T GC T C C T C AAATATC GAGC C AGGGAGC C AG TC AC AAAGGC AG AAAT GC T GGAGAGTGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 TC T GC TC C T C AAAT AT C GAGC C AGGGAGC C AG T C AC AAAGGC AGAAAT GC T GGAGAGTGT 1020 

Qy 4276 CAT C AAAAAT T AC AAGC AC TGT T T T C C T GAGAT C T T C GGC AAAGC C TC T GAGTC C T T GC A 4335 

I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1021 CAT C AAAAAT TACAAGC AC TGTTTTCCT GAGATC TTC GGC AAAGC C TC T GAG TCC T TGC A 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1081 GC T GG T C T T TGGC AT T GAC GTGAAGGAAGC AGAC C C C AC C GGC C AC TC C TAT GTCCTTGT 1140 

Qy 4 396 C AC C T GC C T AGGTC T C T C C TAT GAT GGC C T GC T GGG T GAT AATC AGAT C AT GCC C AAGAC 44 55 

I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 

Db 1141 CACC TGC CTAGGTCTC TCC TATGATGGCC TGC TGGGTGAT AATC AGATC ATGCCC AAGAC 1200 

Qy 4456 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 12 60 

Qy 4516 GGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTA 4575 

I M I I I I I I I I I I I I I II E I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I 

Db 12 61 GGAAATC TGGGAGGAGC TGAGTGTGATGGAGGTGTATGAT GGGAGGGAGCAC AGTGCC TA 1320 

Qy 4 57 6 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4634 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 1321 T GGGGAGC CC AGGAAGC TGC T C AC C C AAGAT T TGGT GC AG GAAAAGT AC C T GGAGT AC C G 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4 695 TGAAAC C AGC T ATGT GAAAGT C C T TGAG TATGT GAT C AAGGT C AG T GC AAGAGT T C GC T T 4754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I M I I I I I 

Db 1441 TGAAAC C AGC T ATGT GAAAGTCCT TGAG TATGT GAT C AAGGT CAGTGC AAGAGT TCGCTT 1500 

Qy 4755 TTTCTTCC CAT CC C T GC GT GAAGC AGC T T T GAGAGAGGAG GAAG AGGGAGTC T GAGC ATG 4814 

I I I I I M I I I II I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 TTTCTTCC CAT C C C T GC GT GAAGC AGC T TTGAGAGAGGAGGAAGAGGGAGT C T GAGC AT G 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 4934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 1680 

Qy 4 935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4994 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 T TAT GAATGAC AGC AG TC AC AC AG T T C T GTGT AT AT AGT T T AAGGGT AAGAG TCTTGTGT 1860 

Qy 5115 T T TAT T C AGAT TGGGAAAT CC AT T C TAT T T T G TGAAT TGGGATAAT AAC AGC AGTGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 TTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAATAACAGC AGTGGAAT 1920 

Qy 517 5 AAGTAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGAT AAAGAAC T AAAGAAAT 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAG TAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGAT AAAGAAC T AAAGAAAT 1980 

Qy 5235 T AAGAGAT AG TC AAT T C T T GC C T TAT AC C TC AG T C TAT T C T GTAAAAT T T T T AAAG ATAT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1981 T AAGAGAT AG TC AAT T C T T GC C TT AT AC C TC AG TC TAT TC TG TAAAAT T T T T AAAG AT AT 2040 

Qy 52 95 AT GC AT AC C T GGAT T TCC T TGGC T T C T T T GAGAAT G TAAGAGAAAT T AAATC TGAATAAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 AT G CAT AC C T GGAT TTCCTTGGCTTCTTT GAGAAT G TAAGAGAAAT T AAAT C T GAAT AAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GTAGAGT C TAGGAGC TGCAGTCAC GTAATC GAGGTGGCAAGATGTCC T C TAAAGAT GTAG 5534 

I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GTAGAGT C TAGGAGC TGCAGTCAC GTAATC GAGG T GGC AAGAT G TC C T C TAAAGAT GTAG 2280 

Qy 5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 2 340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 567 4 

I I I I I I I I I I I I I I I I I I I I 
Db 24 01 TAATGATCTTGGGTGGATCC 242 0 


RESULT 13 
US-11-067-159-81 

; Sequence 81, Application US/11067159 

; Publication No. US20050221440A1 
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; APPLICANT: SIMARD, John, J.L. 

; APPLICANT: DIAMOND, David, C. 

; APPLICANT: LIU, Zheng 
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FILE REFERENCE: MANNK. 027C1 
CURRENT APPLICATION NUMBER: US/11/067,159 
CURRENT FILING DATE: 2005-02-25 
PRIOR APPLICATION NUMBER: US 60/282,211 
PRIOR FILING DATE: 2001-04-06 
PRIOR APPLICATION NUMBER: US 60/337,017 
PRIOR FILING DATE: 2001-11-07 
PRIOR APPLICATION NUMBER: US 60/363,210 
PRIOR FILING DATE: 2002-03-07 
PRIOR APPLICATION NUMBER: US 10/117 937 
PRIOR FILING DATE: 2002-04-04 
NUMBER OF SEQ ID NOS : 602 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 81 
LENGTH: 2 420 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-11-067-159-81 

Query Match 42.4%; Score 2408; DB 13; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 3256 GGAT C C AGGC C C TGC CAGG AAAAATATAAGGGC C C T GC GT GAGAAC AGAGGG GGTC AT C C 3315 

I I I E I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1 GGAT C C AGGC C C TGC C AGGAAAAATATAAGGGC C C T GC GT GAGAAC AG AGGG GG T CAT C C 60 

Qy 3316 AC T GC AT GAGAGTGGGGAT GTC AC AGAG T C C AGC C C AC C C TC C T GGT AGC AC TGAG AAGC 3375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AC T GC AT GAGAGT GGGGAT GTC AC AGAG T C C AGC C C AC C C TC C T GGTAGC AC TGAG AAGC 120 

Qy 337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAAC C AGGC AGT GAGGC C T TGGT C T GAGAC AGT AT C C T C AGG T C AC AGAGC AGAGGATG 34 95 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAAC C AGGC AGT GAGGC C T TGGT CT GAGAC AGT AT CC TC AGG TC AC AGAGC AGAGGATG 240 

Qy 3496 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AGGACAC AT AGGAC TC C AC AGAG TC T GGC C T C AC C T C C C TAC T GTC AGTC C TGT AGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 367 6 GGGAC AGGC C AAC C C AGAGGAC AG GAT T C C C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 37 35 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 421 GGGAC AGGC C AAC C C AGAGGAC AGGAT T C C C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 480 

Qy 3736 GAT C T GT AAGT AGGC C T T T G T TAG AGT C T C C AAGGT T C AG T TC T C AGC T GAG GC C T C TC A 3795 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I 1 I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
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Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GC C TGC T GC C C T GAC GAGAGTC AT C ATG T C TC T TGAGC AGAGGAGTC T GC AC TGC AAGCC 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 601 GC C T GC T GC CC TGAC GAGAG TC AT CAT G TC TC T TGAGC AGAGGAGTC T GC AC T GC AAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I 

Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATC C T C C C C AGAG TC C T C AGGGAGC CTCCGCCTT TC C C AC T AC CAT C AAC T TC AC T C G 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 781 AGATCC T C C C C AGAG T CC T C AGGGAGC CTCCGCCTTTC C C AC T AC CAT C AAC T TC AC T C G 840 

Qy 4096 AC AGAGGC AAC C C AG T GAG GGT T C CAGC AGC C GTGAAGAG GAGGGGC C AAGC AC C T C T T G 4155 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 AC AGAGGC AAC C C AG T GAG GGT T C CAGC AGC C GTGAAGAGGAGGGGC C AAGC AC C T C T T G 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

II I II I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 4275 

I I I I I I I I I I I 11 I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1021 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I M I I I I M I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 1081 GC T GGT C T T T GGC AT TGAC G TGAAGGAAGC AGAC C C C ACC GGC C AC T C C TAT GT C C T T G T 1140 

Qy 4396 C AC C TGC C TAGG TC T C TC C TAT GAT GGC C TGC T GGG T GAT AAT C AGAT CAT GC C C AAGAC 4455 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 1141 C AC C TGC C T AGGTC T C TC C TAT GAT GGC C TGC TGGG T GAT AAT C AGAT C ATGC C C AAGAC 1200 

Qy 4456 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1201 AGGCTTCCTGAT AAT TGTCCTGGTCATGATTGC AAT GGAGGGCGGCC ATGC TCCTGAGGA 1260 

Qy 4516 GGAAAT C T GGGAGGAGC T GAGT GT GAT GGAGG TG T AT GAT GGGAGGGAGC AC AG T GC C T A 4575 

I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 GGAAATC T GGGAGGAGC T GAGT GT GAT GGAGG TGT AT GAT GGGAGGGAGC AC AG T GC C T A 1320 

Qy 4576 TGG GGAG C C C AGGAAGC T GC T C AC C C AAGAT T TGGT GC AGGAAAAGTAC C T GGAGT A- C G 4634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1321 TGGGGAGC C C AGGAAGC T GC T C AC C C AAGAT T TGGT GC AGGAAAAGTAC C T GGAGT AC C G 1380 

Qy 4635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4694 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1441 T GAAAC C AGC T ATGT GAAAGT C C T T GAG TAT G TGAT C AAGGTC AG T GC AAGAG T TC GC T T 1500 
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Qy 4755 TTTCTTCC CAT C C C TGC GT GAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGTC TGAGC ATG 4814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1501 TTTCTTCC CAT C C C TGC GT GAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGTC T GAGC ATG 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 4 934 

I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1621 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 1680 

Qy 4935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4994 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4995 T T T GGAAT T GT T C AAATGT t T T T T T T TAAGGGATGG T TGAAT GAAC T T C AGC ATC C AAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I 
Db 1741 T T T GGAAT T GT T C AAAT GT t T T T T T T TAAGGGATGG T TGAAT GAAC T T C AGC AT C C AAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TTATGAATGAC AGC AGTC AC AC AGT TC T GTGT AT AT AGT T TAAGGGT AAGAG TC T T GTGT 1860 

Qy 5115 T T TAT TC AGAT T GGGAAAT C CAT T C TAT T T T G T GAAT T GG GAT AAT AAC AGC AG T GGAAT 517 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 T T TAT T C AGAT T GGGAAAT C CAT T C TAT T T T G T GAAT T GG GAT AAT AAC AGC AGT GGAAT 1920 

Qy 5175 AAG TAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGAT AAAGAAC TAAAGAAAT 5234 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAG TAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGAT AAAGAAC TAAAGAAAT 1980 

Qy 5235 T AAGAGAT AGT C AAT TC T T GC C T TAT AC C TC AGTC TAT T C T GT AAAAT T T T T AAAGAT AT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 T AAGAGAT AGT C AAT T C T T GC C T TAT AC C TCAGTC TAT T C TGT AAAAT T T T T AAAGAT AT 2040 

Qy 52 95 AT GC AT AC C T GGAT T T C C T TGGC T TC T T TGAGAATG T AAGAGAAAT T AAAT C TGAAT AAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 AT GC AT AC C T GGAT T T C C T TGGC T T C T T T GAGAATG T AAGAGAAAT T AAAT C TGAATAAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 G TAG AGT C TAGGAGC TGC AGTC AC GTAATCGAGGTGGCAAGATGTCC T C TAAAGATGTAG 5534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2221 GTAGAGTC TAGGAGC TGCAGTCAC GTAATCGAGGTGGCAAGATGTCC TC TAAAGATGTAG 2280 

Qy 5535 GGAAAAG T GAGAGAGGGGT GAGGG TGTGGGGC T CC GGGT G AGAG TGG T GGAG T GT C AAT G 5594 

I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2281 GGAAAAG T GAGAGAGGGG T GAGGG T GTGGGGC T CC GGGTGAGAG TGGT GGAG T G T C AAT G 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 
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Qy 5655 TAAT GAT C T TGGGT GGAT C C 567 4 

I I I I I I I I I I I I I I I I I I I I 

Db 2401 TAATGATCTTGGGTGGATCC 2420 


RESULT 14 
US-11-155-288-25 
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Query Match 42.4%; Score 2408; DB 16; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 3256 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 60 

Qy 3316 AC T GC AT GAGAGTGGGGAT GT CAC AGAG TC C AGC C C AC C C T CC T GGT AGC AC T GAGAAGC 3375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AC T GC AT GAGAGTGGGGAT GTC AC AGAG TC C AGC C C AC C C T CC T GGT AGC AC TGAGAAGC 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAACCAGGC AGTGAGGCC T TGGT C TGAGACAGTAT CC TC AGGT CACAGAGC AGAGGATG 3495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAACCAGGCAGTGAGGCC TTGGTCTGAGACAGTATCC TC AGGT CACAGAGC AGAGGATG 240 

Qy 3496 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AGGAC AC AT AGGAC TC C ACAGAG TC TGGC C T CAC C TC C C TAC T GT C AG T C C T GT AGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 C AGGAC AC AT AGGAC TCC AC AGAG TC T GGC C T CAC C TC C C TAC T GT C AG T C C TGT AGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGG AC AGGCC AACC C AGAGGAC AGGAT T CC C T GGAG GC C AC AGAGGAGC AC C AAGG AGAA 3735 

I I I I I I I I I i I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I II I I I I I 
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Db 421 GGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCACAGAGGAGCACCAAGGAGAA 480 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I t I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GC C T GC T GC C C T GAC GAGAGT C AT CAT G T C TC T TGAGC AGAGGAGT C T GC AC T GC AAGC C 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 601 GC C T GC T GC C C T GAC GAGAGT CAT CAT G T C TC T TGAGC AGAGGAGT C T GC AC TGC AAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATC C T C CC C AGAG T CC T C AGGGAGC C TC C GCC TT T CC C AC T AC CAT C AAC T TC AC T C G 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AGAT C C T C C C C AGAG T CC T C AGGGAGC CTCCGCCTTT CC C AC TAC CAT CAAC T TC AC T CG 840 

Qy 4096 ACAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTG 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 ACAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TC T GC TC C TCAAATATC GAGCCAGGGAGCCAGTCAC AAAGGCAGAAAT GC TGGAGAGTGT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 1080 

Qy 4 336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4 395 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 C AC C TGC CTAGGTCTCTCCTATGATGGCC TGC TGGGTGATAATC AGATC ATGCCCAAGAC 4455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 
Db 1141 C AC C TGC CTAGGTCTCTCCTATGATGGCC TGC TGGGTGATAATC AGATC ATGCCCAAGAC 1200 

Qy 4456 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 1260 

Qy 4516 GGAAAT C T GGGAGGAGC T GAGTGT GATGGAGG T GT AT GAT GGGAGGGAGC AC AGTGCC T A 4575 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 GGAAAT C T GGGAGGAGC TGAGTGT GAT GGAGG T GT AT GAT GGGAGGGAGC AC AGT GCC TA 1320 

Qy 4 57 6 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4 634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I II 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACCG 1380 
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Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGC TATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 1500 

Qy 4755 TTTCTTCC CAT C C C T GCGT GAAGC AGC T TT GAGAGAGGAGGAAGAGGGAGTC T GAGC ATG 4814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1501 TTTCTTCC CAT C C C T GC GT GAAGC AGC T TT GAGAGAGGAGGAAGAGGGAGTC TGAGC ATG 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGC AGC T T C C C C T GC C T C G T GTGAC AT G AGGC C CAT TC T T C AC T C T GAAGAGAGCG GTC A 4934 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AGC AGC TTCCCCTGCCTCG T GTGAC AT GAGGC C CAT TCTTCACTCT GAAGAGAGCGGTC A 1680 

Qy 4 935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4 994 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4 995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 18 60 

Qy 5115 T T T AT TC AGAT T GGGAAAT C C ATT C TAT T T T G TGAAT T GGGAT AATAAC AGC AG TG GAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 TTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGGATAATAACAGCAGTGGAAT 1920 

Qy 5175 AAG TAC T TAGAAATG TGAAAAATGAGCAGTAAAATAGATGAGAT AAAGAAC T AAAGAAAT 5234 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAG TAC T TAGAAAT G TGAAAAATGAGC AGT AAAATAGAT GAGAT AAAGAAC T AAAGAAAT 1980 

Qy 5235 TAAGAGATAGTCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATAT 52 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I II I I I I I I I I 
Db 1981 TAAGAGATAGTCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATAT 2040 

Qy 5295 AT GC AT AC C T GGAT T TC C T TGGC T T C T T T GAGAAT G T AAGAGAAAT TAAATC TGAAT AAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 AT GC AT AC C T GGAT T TC C T TGGC T T C T T T GAGAAT G T AAGAGAAAT TAAATC TGAAT AAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAG 5534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAG 2280 
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Qy 5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I t I I I I 
Db 2281 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I It I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGAT C T TGGGTGGATC C 5674 

I I I I I I I I I I II I I I I I I I I 
Db 2401 TAATGAT CT TGGGTGGATC C 2420 


RESULT 15 
US-10-093-766-41 

Sequence 41, Application US/10093766 
Publication No. US20030013099A1 
GENERAL INFORMATION: 
APPLICANT: Lasek, Amy W. 
APPLICANT: Jones, David A. 
APPLICANT: Karpf, Adam R. 

TITLE OF INVENTION: GENES REGULATED BY DNA METH YLAT ION IN COLON TUMORS 
FILE REFERENCE: PA-0047 US 

CURRENT APPLICATION NUMBER: US/10/093,7 66 
CURRENT FILING DATE: 2002-03-07 
NUMBER OF SEQ ID NOS : 61 
SOFTWARE: PERL Program 
SEQ ID NO 41 
LENGTH: 2 420 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/KEY : misc_f eature 

OTHER INFORMATION: Incyte ID No. US20030013099A1 410721.1 
US-10-093-766-41 

Query Match 42.4%; Score 2404.8; DB 6; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2417; Conservative 0; Mismatches 2; Indels 1; Gaps 1; 

Qy 3256 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 60 

Qy 3316 AC T GC AT GAGAGT GGGGAT GTC AC AGAG TC C AGC C C AC C C T C C T GGTAGC AC TGAGAAGC 3375 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 AC T GC AT GAGAGT GGGGAT G TC AC AGAG TC C AGC C C AC C C T C C T GGTAGC AC T GAGAAGC 120 

Qy 337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAACCAGGCAGTGAGGCC TTGGT C TGAGACAGTATCC TC AGGT CACAGAGC AGAG GAT G 3495 

I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I 
Db 181 GGAACC AGGC AGTGAGGC C T TGGT C TGAGAC AGTAT C C T C AGG T CACAGAGC AGAG GATG 240 

Qy 34 96 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 CAGGACACATAGGAC TCCACAGAGTCTGGCCTCACC TCCC TACTGTCAGTCC TGTAGAAT 3615 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 301 CAGGACACATAGGAC TCCACAGAGTCTGGCCTCACC TCCC TACTGTCAGTCCTGTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 367 6 GGGAC AGGC C AAC C C AGAGGAC AGGAT T CC C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 37 35 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 421 GGGACAGGC C AAC CC AGAGGAC AGGAT T CC C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 480 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GC C T GC T GCC C TGAC GAGAG T CAT CAT G T C TC T TGAGCAGAGGAGT C T GC AC T GC AAGC C 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GC C T GC T GC C C TGAC GAGAGT C AT C ATG TC TC T TGAGCAGAGGAGT C T GC AC T GC AAGC C 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 81 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 840 

Qy 4096 ACAGAGGCAACCCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTG 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AC AGAGGC AAC C C AG T GAGGGT TC C AGC AGC C GTGAAGAGGAGGGGC C AAGC AC C T C T TG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCT C AAATAT C GAGC C AGGGAGC C AG T C AC AAAGGC AGAAAT GC T GGAGAGT GT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCTGCTCCT C AAATAT C GAGC C AGGGAGC C AG T C AC AAAGGC AGAAAT GC T GGAGAGTGT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I 
Db 1021 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4 396 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 44 55 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 1200 

Qy 4 456 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4 515 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 1260 

Qy 4 516 GGAAAT C TGGG AGGAGC TGAGTGT GATGGAGG T GTATGAT GGGAGGGAGC AC AGTGC C T A 4575 

I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1261 GGAAAT.C T GGGAGGAGC TGAGTGT GAT GGAGG TGTAT GAT GGGAGGGAGC AC AGTGC C TA 1320 

Qy 4 57 6 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4 634 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 
Db 1321 T GGGGAGCC C AGGAAGC TGC T C AC C C AAGAT T TGG T GC AGGAAAAGT AC C T GGAGT AC C G 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4 695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 1500 

Qy 4755 TTTCTTCC CAT C CC T GCGT GAAGC AGC T T T GAGAGAGGAGGAAGAGGGAGTC TGAGC ATG 4814 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1501 TTTCTTCC CAT C CC T GCGT GAAGC AGC T T T GAGAGAGGAG GAAGAGGGAGT C TGAG CAT G 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AGT TGC AGC CAGGGCCAGTGGGAGGGGGACTGGGCC AGTGC AC CTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGC AGC TTCCCCTGCCTCGTGT GAC ATG AGGC C CAT TC T T C AC T C TGAAGAGAGC GGT C A 4934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AGC AGC T TC C C C TGC C T C G T G T GAC ATGAGGC C CAT TC T T C AC T C T GAAGAG AGC GGT C A 1680 

Qy 4 935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4 994 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4 995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1741 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1801 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 1860 

Qy 5115 T T TAT T C AGAT T GGGAAAT C CAT T C TAT T T TG TGAAT T GG GATAATAAC AGC AGTGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T T TAT T C AGAT TGGG AAAT C CAT T C TAT T T TG TGAAT T GGGATAAT AAC AGC AG T G GAAT 1920 

Qy 5175 AAGTAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGAT AAAGAACTAAAGAAAT 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAGTAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGAT AAAGAACTAAAGAAAT 1980 

Qy 5235 TAAGAGATAGT C AAT T C T T GCC T TAT AC C T C AG T C T AT TC T GT AAAAT T T T T AAAGAT AT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 T AAGAGAT AG T CAAT T C T T GC T T TAT AC C T C AGT C T AT TC T G T AAAAT T T T T AAAGAT AT 2040 

Qy 52 95 AT GC AT AC C TGGAT T T C C T TGGC T T C T T TGAG AAT G T AAG AGAAAT T AAAT C TGAAT AAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 ATGC AT AC C T GGAT T T C C T T GGC T T C T T TGAG AATG T AAG AG AAAT TAAAT C TGAATAAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 
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*3) 


Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GTAGAG T C T AGGAGC TGC AGT C AC G T AATC GAGGTGGC AAGAT G TCC T CTAAAGAT G TAG 5534 

I I I I I II I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I III I I M I I I I I I I 
Db 2221 GTAGAGT C T AGGAGC T GC AGTC AC GT AATC GAGGTGGC AAGAT G TCC T C TAAAGAT GT AG 2280 

Qy 5535 GGAAAAG T GAGAGAGGGGT GAGGG TGT GGGGC T C C GGGT GAGAG T GGT GGAGT GTC AAT G 5594 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I II I I I I 
Db 2401 TAATGATCTTGGGTGGATCC 2420 
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This page gives you Search Results detail for the Application 08819669 and Search Result us-08- 

819-669e-8.rnpbn. 

start 
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GenCore version 5.1.9 
Copyright {c) 1993 - 2006 Biocceleration Ltd. 

OM nucleic - nucleic search, using sw model 

Run on: August 25, 2006, 13:39:22 ; Search time 856 Seconds 

(without alignments) 
10803.4 93 Million cell updates/sec 

US-08-819-669E-8 
5674 

1 CCCGGGGCACCACTGGCATC T AATGATC T T GGGT GGAT C C 5674 


Title: 

Perfect score: 
Sequence : 

Scoring table: 


I DENT I T Y_NUC 

Gapop 10.0 , Gapext 1.0 


Searched: 2239192 seqs, 814926892 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 


4478384 


Database 


Published_Applic 

1: /EMC_Celerra 

2: /EMC_Celerra 

3: /EMC_Celerra 

4 : /EMC_Celerra 

5: /EMC_Celerra 

6: /EMC_Celerra 

7 : /EMC_Celerra 

8 : /EMC_Celerra 

9 : /EMC_Celerra 

10: /EMC Celerra 


a tions_NA_New : * 

SIDS3/ptodata/2/pubpna/US09_NEW_PUB. seq: 
SIDS3/ptodata/2/pubpna/US06_NEW_PUB.seq: 
SIDS3/ptodata/2/pubpna/US07_NEW_PUB.seq: 
SIDS3/ptodata/2/pubpna/US08_NEW_PUB.seq: 
SIDS3/ptodata/2/pubpna/PCT_NEW_PUB . seq: * 
SIDS3/ptodata/2/pubpna/US10_NEW_PUB.seq: 
SIDS3/ptodata/2/pubpna/USll_NEW_PUB.seq: 
SIDS3/ptodata/2/pubpna/USll_NEW_PUB.seql 
SIDS3 /ptoda ta /2 /pubpna/US 1 1_NEW_PUB . s eq2 
SIDS3/ptodata/2/pubpna/US60_NEW_PUB. seq 


Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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Result Query 

No. Score Match Length DB ID Description 



1 

5674 

100 

0 

5674 

8 

US- 

11 


2 

2419 

42 

6 

2419 

8 

us- 

11 


3 

2408 

42 

4 

2420 

9 

us- 

11 


4 

2408 

42 

4 

2420 

9 

US- 

11 


5 

2058 . 8 

36 

3 

4157 

8 

us- 

11 


6 

1762 . 6 

31 

1 

4204 

9 

us- 

11 


7 

1762 . 6 

31 

1 

4204 

9 

us- 

11 


8 

1678 . 8 

29 

6 

2531 

8 

us- 

11 


9 

1678 . 8 

29 

6 

2531 

8 

us- 

11 


10 

1504 . 6 

26 

5 

2305 

8 

us- 

11 


11 

1410 . 8 

24 

9 

2226 

8 

us- 

11 


12 

1188 . 2 

20 

9 

1577 

8 

us- 

11 


13 

1188 . 2 

20 

9 

1577 

8 

us- 

11 

c 

14 

1188 . 2 

20 

9 

1577 

8 

us- 

11 


15 

988 . 8 

17 

4 

1640 

8 

us- 

11 


16 

939 . 2 

16 

6 

1000 

8 

us- 

11 

c 

17 

939.2 

16 

6 

1000 

8 

us- 

11 


18 

900.2 

15 

9 

1810 

8 

us- 

11 


19 

830. 6 

14 

6 

1947 

8 

us- 

11 


20 

815.2 

14 

4 

1412 

8 

us- 

11 


21 

750. 8 

13 

2 

1068 

8 

us- 

11 

c 

22 

720.2 

12 

7 

747 

8 

us- 

11 


23 

699 . 6 

12 

3 

1000 

8 

us- 

11 

c 

24 

699. 6 

12 

3 

1000 

8 

us- 

11 


25 

647 . 8 

11 

4 

942 

8 

us- 

11 


26 

647 . 8 

11 

4 

942 

8 

us- 

11 

c 

27 
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11 

4 

942 

8 

us- 

11 


28 

646. 6 

11 

4 
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8 

us- 

11 

c 

29 
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11 

4 

1000 

8 

us- 

11 


30 

64 6. 6 

11 

4 

1000 

8 

us- 

11 

c 

31 

64 6. 6 

11 

4 

1000 

8 

us- 

11 


32 

634 . 4 

11 

2 

1000 

8 

us- 

11 

c 

33 

634 . 4 

11 

2 

1000 

8 

us- 

11 


34 

634 . 4 

11 

2 

1000 

8 

us- 

11 

c 

35 

634 . 4 

11 

2 

1000 

8 

us- 

11 


36 

633 

11 

2 

1000 

8 

us- 

11 


37 

633 

11 

2 

1000 

8 

us- 

11 

c 

38 

633 

11 

2 

1000 

8 

us- 

11 


39 

627 

11 

1 

1000 

8 

us- 

11 

c 

40 

627 

11 

1 

1000 

8 

us- 

11 


41 

583. 4 

10 

3 

1107 

8 

us- 

11 


42 

567 

10 

0 

1231 

8 

us- 

11 


43 

567 

10 

0 

1231 

8 

us- 

11 

c 

44 

567 

10 

0 

1231 

8 

us- 

11 


45 

542.2 

9 

6 

1200 

8 

us- 

11 
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US-11-253-240-8 

; Sequence 8, Application US/11253240 
; Publication No. US20060127356A1 
GENERAL INFORMATION: 

APPLICANT: Gaugler, Batrice; Van den Eynde, BenoEt; 

van der Bruggen, Pierre; Boon-Falleur , Thierry 
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TITLE OF INVENTION: Isolated Nucleic Acid Molecules Coding For 
; Tumor Rejection Antigen Precursor Mage-3 And Uses Thereof 

NUMBER OF SEQUENCES : 30 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 

STREET: 805 Third Avenue 

CITY: New York City 

STATE: New York 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM 

OPERATING SYSTEM: PC-DOS 

SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/11/253,24 0 

FILING DATE: 17-Oct-2005 

CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/09/57 9,54 3 

FILING DATE: 26-May-2000 

APPLICATION NUMBER: 09/583,850 

FILING DATE: 

APPLICATION NUMBER: PCT/US92 /04 3 54 

FILING DATE: 22-MAY-1992 

APPLICATION NUMBER: 07/807,043 

FILING DATE: 12-DECEMBER-1991 

APPLICATION NUMBER: 07/764,365 

FILING DATE: 23-SEPTEMBER-1991 

APPLICATION NUMBER: 07/728,838 

FILING DATE: 9-JULY-1991 

APPLICATION NUMBER: 07/705,702 

FILING DATE: 23-MAY-1991 
ATTORNEY /AGENT INFORMATION: 

NAME: Hanson, Norman D. 

REGISTRATION NUMBER: 30,946 

REFERENCE /DOCKET NUMBER: LUD 535 3 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 8: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 5674 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
MOLECULE TYPE: genomic DNA 
FEATURE : 

NAME/KEY: MAGE-1 gene 
SEQUENCE DESCRIPTION: SEQ ID NO: 8: 
US-11-253-240-8 

Query Match 100.0%; Score 5674; DB 8; Length 5674; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 567 4; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CCCGGGGCACCACTGGCATCCCTCCCCCTACCACCCCCAATCCCTCCCTTTACGCCACCC 60 

Qy 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 61 ATCCAAACATCTTCACGCTCACCCCCAGCCCAAGCCAGGCAGAATCCGGTTCCACCCCTG 120 

Qy 121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CTCTCAACCCAGGGAAGCCCAGGTGCCCAGATGTGACGCCACTGACTTGAGCATTAGTGG 180 

Qy 181 TTAGAGAGAAGCGAGGT TT TCGGT C TGAGGGGCGGC TTGAGATC GGTGGAGGGAAGCGGG 240 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TTAGAGAGAAGCGAGGTTTTCGGTCTGAGGGGCGGCTTGAGATCGGTGGAGGGAAGCGGG 240 

Qy 241 C C C AGC T C TG T AAGG AGGC AAGGT GAC AT GC T GAGGGAGGAC T GAGGAC CC AC T T AC CCC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 241 CCC AGC T C T GTAAGGAGGC AAGGT GAC AT GC T GAGG GAGGAC TG AGGAC C C AC T TAC CCC 300 

Qy 301 AGAT AGAGGAC C C C AAAT AATC CC T TC AT GC C AGTC C TGGAC CATC TGGTGG T GGAC T TC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AGATAGAGGACCCCAAATAATCCCTTCATGCCAGTCCTGGACCATCTGGTGGTGGACTTC 360 

Qy 361 TC AGGC T GGGC C AC CCC C AGC CCCCTTGCTGCT T AAAC C AC TGGGGAC T C GAAGT C AGAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 361 TCAGGCTGGGCCACCCCCAGCCCCCTTGCTGCTTAAACCACTGGGGACTCGAAGTCAGAG 420 

Qy 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 421 CTCCGTGTGATCAGGGAAGGGCTGCTTAGGAGAGGGCAGCGTCCAGGCTCTGCCAGACAT 480 

Qy 481 CAT GC T C AGGAT TC TC AAGGAGGGC T GAGGG T C C C T AAGAC C C C AC T C C C G T GAC C C AAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CAT GC T C AGGAT TC TC AAGGAGGGC T GAGGG T C C C T AAGAC CC C AC T C C C GT GAC C C AAC 540 

Qy 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCACTCCAATGCTCACTCCCGTGACCCAACCCCCTCTTCATTGTCATTCCAACCCCCA 600 

Qy 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCACATCCCCCACCCCATCCCTCAACCCTGATGCCCATCCGCCCAGCCATTCCACCCT 660 

Qy 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CACCCCCACCCCCACCCCCACGCCCACTCCCACCCCCACCCAGGCAGGATCCGGTTCCCG 720 

Qy 721 CCAGGAAACATCCGGGTGCCCGGATGTGACGCCACTGACTTGCGCATTGTGGGGCAGAGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 C C AGGAAAC AT C C GGGT GC C C GGAT GT GAC GC CAC T GAC T TGC GC AT T GT GGGGC AGAGA 780 

Qy 781 GAAGC GAGG T T T C CAT T C T GAGGG AC GGC GT AGAGT TCGGC C GAAGGAAC C T GAC C C AGG 840 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GAAGC GAGGT T T C C AT T C T GAGGG AC GGC GT AGAGT TC GGC C GAAGGAAC C T GAC C C AGG 840 

Qy 841 C TC TGTGAGGAGGCAAGGT GAGAGGC TGAGGGAGGACTGAGGAC CCCGCCAC TC CAAATA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 C TC TGTGAGGAGGCAAGGT GAGAGGC TGAGGGAGGACTGAGGAC CCCGCCAC TC CAAATA 900 

Qy 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GAGAGCCCCAAATATTCCAGCCCCGCCCTTGCTGCCAGCCCTGGCCCACCCGCGGGAAGA 960 

Qy 961 CGTCTCAGCCTGGGCTGCCCCCAGACCCCTGCTCCAAAAGCCTTGAGAGACACCAGGTTC 1020 

I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I 
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Db 961 C GT C TC AGC C T GGGC TGC C CC CAGACC C C TGC TC C AAAAGC C T T GAGAGAC AC C AG GT TC 1020 

Qy 1021 T TC TC C C C AAGC TC T GGAATC AGAGGT T GC T G TGAC C AGGGC AGGAC T GG T T AGGAGAGG 1080 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I t I I I I I I I I I 

Db 1021 T T C TC C C C AAGC T C T GGAATC AGAGGT T GC T G T GAC C AGGGC AG GAC T GGT T AGGAGAGG 1080 

Qy 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 GCAGGGCACAGGCTCTGCCAGGCATCAAGATCAGCACCCAAGAGGGAGGGCTGTGGGCCC 1140 

Qy 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 CCAAGACTGCACTCCAATCCCCACTCCCACCCCATTCGCATTCCCATTCCCCACCCAACC 1200 

Qy 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 CCCATCTCCTCAGCTACACCTCCACCCCCATCCCTACTCCTACTCCGTCACCTGACCACC 1260 

Qy 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 ACCCTCCAGCCCCAGCACCAGCCCCAACCCTTCTGCCACCTCACCCTCACTGCCCCCAAC 1320 

Qy 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCACCCTCATCTCTCTCATGTGCCCCACTCCCATCGCCTCCCCCATTCTGGCAGAATCC 1380 

Qy 1381 GGT T TGC CCCTGCTCTCAACCCAGGGAAGCCCTGGTAGGCCCGATGTGAAACCAC TGAC T 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GG T T T GC C C C T GC TC T C AACC C AGGGAAGC C C TGGT AGGC CC GAT GT GAAAC C AC T GAC T 1440 

Qy 1441 TGAAC C T C AC AGAT C T GAGAGAAGCC AGGT TC AT T T AAT GG T TC T GAGGGGC GGC T T GAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 TGAAC C T C AC AGAT C T GAGAGAAGC C AG GT T C AT TT AATGG T T C T GAGGGGC GGC T T GAG 1500 

Qy 1501 ATC C AC T GAGGGGAG T GGT T T TAGGC T C TGT GAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 ATC C AC T GAGGGGAG T GGT T T TAGGC T C TGT GAGGAGGC AAGGT GAGAT GC T GAGGGAGG 1560 

Qy 1561 AC T GAGGAGGC AC AC ACC C C AGGT AGAT GGC C C C AAAAT GAT C C AGT AC C AC C C C T GC TG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AC T GAGGAGGC AC AC ACC C C AGGT AGAT GGC C C C AAAAT G ATC C AGT AC C AC C C C T GC T G 1620 

Qy 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1621 CCAGCCCTGGACCACCCGGCCAGGACAGATGTCTCAGCTGGACCACCCCCCGTCCCGTCC 1680 

Qy 1681 C AC TGC C AC T T AAC C C AC AGGGC AATC T GT AGT CAT AGC T TAT G T GAC C GGG GC AGGGT T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 CACTGCCACTTAACCCACAGGGCAATCTGTAGTCATAGCTTATGTGACCGGGGCAGGGTT 1740 

Qy 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GGTCAGGAGAGGCAGGGCCCAGGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGG 1800 

Qy 1801 ACC CTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCT CATC TCCACCGCC ACC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 ACC CTGGGAGGGAACTGAGGGTTCCCCACCCACACCTGTCTCCT CATC TCCACCGCC ACC 1860 

Qy 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 CCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGTCAGAATCCCTGCTG 1920 
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Qy 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 1921 TCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCACTCGGATCTTGACGTCCCCATCCA 1980 

Qy 1981 GGGTC TGATGGAGGGAAGGGGC TT GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC CTAC 2040 

I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GGGTC TGATGGAGGGAAGGGGC TT GAAC AGGGCC TC AGGGGAGC AGAGGGAGGGCC C TAC 2040 

Qy 2041 TGCGAGATGAGGGAGGCCTCAGAGGACCCAGC ACCC TAGGACACCGCACCCC TGTC TGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 1 I I E I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 TGC GAGAT GAGGGAGGC C T C AGAGGAC C C AGC AC CC T AGGAC AC C GC AC C CC T GTC TGAG 2100 

Qy 2101 AC T GAGGC T GC C AC T TC TGGC C TC AAGAATC AGAAC GATGGGGAC T C AGAT T GC AT GGGG 2160 

I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC T GAGGC TGC CAC T TCTGGCCTC AAGAATCAGAAC GATGGGGAC TCAGATT GCATGGGG 2160 

Qy 2161 GTGGGAC CCAGGCC T GCAAGGC TTACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGACC T T 2220 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GTGGGAC CCAGGCC T GCAAGGC TTACGC GGAGGAAGAGGAGGGAGGAC TCAGGGGACC TT 2220 

Qy 2221 GGAATCCAGATCAGTGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGAAT C C AGAT C AGT GT GGAC C T C GGC C C T GAGAGG T CC AGGGC AC GG T GGC CAC AT AT G 2280 

i 

Qy 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCCATATTTCCTGCATCTTTGAGGTGACAGGACAGAGCTGTGGTCTGAGAAGTGGGGCC 2340 

Qy 2341 TC AGGT C AAC AGAGGGAGGAGT T C C AGGAT C CAT AT GGC C C AAGAT G T GC C C C C T T CAT G 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 T C AGGT C AAC AGAGG GAGGAGT T C C AGGAT C CAT AT GGC C C AAGAT GT GCCCCCTT CAT G 2400 

Qy 2401 AGGAC T G GGGAT ATC C C C GGC T C AGAAAGAAGGGAC T CC AC AC AG T C T GGC TGTCCCCTT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGGAC T GGGGAT AT C C C C GGC T CAGAAAGAAGGGAC TCC AC AC AGT C T GGC TGTCCCCTT 24 60 

Qy 24 61 TTAGTAGCTCTAGGGGGACCAGATCAGGGATGGCGGTATGTTCCATTCTCACTTGTACCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 T TAGT AGC T C T AGGGGGAC C AGAT CAGGGATGGC GG TAT G T TC C AT T C T CAC T T G TAC C A 2520 

Qy 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGAT GGGG TCTT GGGG TAAAGGGGGGATGTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAGGCAGGAAGTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGG TAAAGGGGGGATGTCT 2580 

Qy 2581 ACTCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGCTGGCAGGAATAAAGATGAGT 2 640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I M I 
Db 2581 AC TCATGTCAGGGAATTGGGGGTTGAGGAAGCACAGGCGC TGGC AGGAATAAAGAT GAG T 2 640 

Qy 2 641 GAGACAGACAAGGCTATTGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACACC 2 700 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I II I 
Db 2641 GAGAC AG AC AAGGC TAT T GGAAT C CAC AC C C C AGAAC C AAAGGG G T C AGC C C TGGAC AC C 2700 

Qy 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCACCCAGGATGTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCT 2760 

Qy 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 CATTCTCAGAGGGTGACTCAGGTCAACGTAGGGACCCCCATCTGGTCTAAAGACAGAGCG 2820 
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Db 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 


2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

' I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I t I I 
2821 GTCCCAGGATCTGCCATGCGTTCGGGTGAGGAACATGAGGGAGGACTGAGGGTACCCCAG 2880 

2881 GAC C AGAAC AC T GAGGGAGAC TGC AC AGAAAT C AGC CCTGCCCCTGC T GTC AC C CC AGAG 2940 

I I I I I i I I 1 I I I I I I I I I I I 1 I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I 1 I 
2881 GAC C AGAAC AC TGAGGGAGAC TGC AC AG AAAT C AGC CCTGCCCCTGCT GT C AC C C C AGAG 2940 

2941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 AGCATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGG 3000 

3001 ACGGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 AC GGGGAGGC C T T GG T C T GAGAAGGC T GC GC T C AGG T C AG TAGAGGGAGC GT C C CAGGCC 3060 

3061 C TGCCAGGAGT CAAGGTGAGGACC AAGC GGGC AC C T CACC CAGGACACAT TAAT TC CAAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 C T GC C AGGAG T C AAGGT GAGGACC AAGC GGGC AC C T C AC C CAGGACACAT TAAT T C CAAT 3120 

3121 GAAT T T T GAT ATC T C T T GC TGC CC T TC C C C AAGGAC C T AGGC AC GTGT GGC C AGAT GT T T 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
3121 GAAT T T T GAT ATC T C T T GC TGC CC T TC C C C AAGGAC C T AGGC AC GTGT GGC C AGAT GT T T 3180 

3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I 
3181 GTCCCCTCCTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTGATTTGGATTTCTCAG 3240 

3241 AC C AGC AAAAG GGC AGGAT CC AGGC CC T GC C AGGAAAAAT ATAAGGGC C C TG C GTGAGAA 3300 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3241 AC C AGC AAAAGGGC AGGAT C C AGGC CC T GC C AGGAAAAAT AT AAGGGC C C T GC G TG AGAA 3300 

3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3301 CAGAGGGGGTCATCCACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTG 3360 

3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3361 GTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCT 3420 

3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3421 CTTCCTGGAGCTCCAGGAACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTC 3480 

3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3481 ACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAA 3540 

3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3541 GGGCCCCACCTGCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTG 3600 

3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3601 TCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCT 3660 

3661 CC T TCAGGTTT TCAGGGGAC AGGC CAAC CCAGAGGACAGGAT TC CC TGGAGGC C AC AGAG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3661 CC T TCAGGTTT TCAGGGGAC AGGC CAAC CCAGAGGACAGGAT TC CC TGGAGGCC AC AGAG 3720 

3721 GAGC AC C AAGGAGAAGAT C TG T AAGT AGGC C T T T GT T AGAG T C T C C AAGGT T C AGT TC T C 3780 
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1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 ll 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3721 GAGC AC C AAGGAGAAGATC T G T AAG TAGGC C T T TGT TAGAGTC T C C AAGG T T C AGT TC TC 3780 

Qy 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCT 3840 

Qy 3841 C C T GC C C AC AC TCCTGCCTGCTGCCCT GAC GAGAGT C AT CATGTCTCTT GAGC AGAGGAG 3900 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I 
Db 3841 C C T GC C C AC AC TCCTGCCTGCTGCCCT GAC GAGAGT CAT CATGT C T C T TGAGC AGAGGAG 3900 

Qy 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 TCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTG 3960 

Qy 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCC 4020 

Qy 4021 C AC TGC T GGGT C AAC AGAT C C TC C C C AGAGT C C T C AGGGAGC CTCCGCCTTTCC C AC TAC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 4021 C AC TGC T GGGT C AAC AGAT C C TC C C C AGAGT C C T C AGGGAGC CTCCGCCTTTCC C AC TAC 4080 

Qy 4081 CAT C AAC T T C AC T CGAC AG AGGC AACC C AGT GAGGG T T C C AGC AGC C GT GAAGAGGAGGG 4140 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CAT C AAC T T C AC T C GAC AG AGGC AAC C C AG T GAGGG T T C C AGC AGC C G T GAAGAGGAGGG 4140 

Qy 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGC 4200 

Qy 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4201 TGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGA 4260 

Qy 4261 AATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGC 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AAT GC T GGAGAG TGT C AT C AAAAAT T AC AAGC AC TGTTTTCC TG AGAT C T T C GGC AAAGC 4320 

Qy 4 321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4321 CTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCA 4380 

Qy 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 44 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 CTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCA 4440 

Qy 4441 GAT CAT GCC C AAGAC AGGC T T C C T GAT AAT T G T C C T GGT C ATGAT TGC AATG GAGGGC GG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I 
Db 4441 GAT CAT GC C C AAGAC AGGC T T C C T GAT AAT T G T C C T GGT CAT GAT TGC AATG GAGG GC GG 4500 

Qy 4501 C CAT GC TC C TGAGGAGGAAAT C TGGGAGGAGC T GAG TGTG AT GGAGGT GTAT GATGGGAG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4501 C CAT GC TC C T GAGGAGGAAAT C TGGGAGGAGC T GAG TGTG AT GGAGGT GTAT GAT GGGAG 4560 

Qy 4561 GGAGC AC AGTGCC TATGGGGAGC C CAGG AAGC TGC T CAC C C AAG AT T TGGTGC AGGAAAA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4561 GGAGC AC AG T GC C TAT GGGGAGC C CAGG AAGC TGC T CAC C C AAG AT T T GG T GC AGGAAAA 4620 

Qy 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 4621 GTACCTGGAGTACGGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGT 4680 

Qy 4681 CCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGT 4740 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4681 CC AAGGGC C C T C GC TGAAAC C AGC T ATG TGAAAG T C C T T GAGTATG T GAT C AAGG T C AGT 4740 

Qy 47 41 GC AAGAG TTCGCTTTTTCTTCC C ATCC C TGC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 GC AAGAG TTCGCTTTTTCTTCC C ATCC C T GC G TGAAGC AGC T T T GAGAGAGGAGGAAGAG 4800 

Qy 4801 GGAGTC T GAGC ATGAGT T GCAGC C AAGG C C AG T GGGAGGG GGAC TGGGC C AG T GC AC C T T 4860 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 GGAGTC TGAGC ATGAGT TGC AGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTT 4860 

Qy 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 48 61 CCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCT 4 920 

Qy 4921 GAAGAGAGC GG TC AG T GT T C T CAG T AGT AGGT T TC T GT T C TAT T GGG T GAC T T GGAGAT T 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 GAAGAGAGC GG TC AG T GT T C TC AG T AGT AGGT T TC T GT T C TAT T GGGT GAC T T GGAGAT T 4980 

Qy 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I 
Db 4981 TATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAAC 5040 

Qy 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 TTCAGCATCCAAGTTTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGG 5100 

Qy 5101 T AAGAG TCTTGTGTTT TAT TC AGAT TGGGAAAT C CAT T C TAT T T T GT G AAT T GGGAT AAT 5160 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 T AAGAG TCTTGTGTTT TAT TC AGAT TGGGAAAT CC AT T C TAT T T TGT GAAT T GGGAT AAT 5160 

Qy 5161 AAC AGC AGT GGAAT AAGT AC T T AGAAAT GT GAAAAAT GAGC AGT AAAAT AGAT GAGATAA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 AAC AGC AGT GGAAT AAGT AC T T AGAAAT GT GAAAAAT GAGC AGT AAAAT AGAT GAGATAA 5220 

Qy 5221 AGAAC T AAAGAAAT T AAGAGATAGT CAAT T C T TGC C T TAT AC C T C AGT C TAT T C T GTAAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGAAC TAAAGAAAT T AAGAGATAGT CAAT T C T TGC C T TAT AC C T CAG T C TAT T C T GTAAA 5280 

Qy 5281 AT T T T T AAAGAT ATATGC ATAC C T GGAT T T C C T TGG C T T C T T T GAGAAT G T AAGAGAAAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 AT T T T T AAAGAT AT ATGC ATAC C T GGAT T T C C T TGG C T TC T T T GAGAAT GT AAGAGAAAT 5340 

Qy 5341 TAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 TAAATCT GAAT AAAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCC ATGC AC TGAGCA 54 00 

Qy 5401 TCTGCTTTT T GGAAGGC C C T GGGT TAG TAGTGGAGATGC T AAGG T AAGC C AGAC T CAT AC 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATAC 5460 

Qy 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 61 CCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTC 5520 

Qy 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTG 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 CTCTAAAGATGTAGGGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTG 5580 
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Qy 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

I I I I I I I I I I M I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 GTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCT 5640 

Qy 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I II I 
Db 5641 GGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 
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APPLICATION NUMBER: US/11/253,24 0 
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CLASSIFICATION: 
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STRANDEDNESS : single 
TOPOLOGY: linear 
MOLECULE TYPE: genomic DNA 
SEQUENCE DESCRIPTION: SEQ ID NO: 7: 
US-11-253-240-7 

Query Match 42.6%; Score 2419; DB 8; Length 2419; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 3256 GGATC C AGGC C C TGC C AGG AAAAATATAAGGGC C C T GC GT GAGAAC AGAGGGGG TC ATC C 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGATC C AGGC C C TGC C AGG AAAAATATAAGGGC C C T GC GT GAGAAC AGAGGGGGTC ATC C 60 

Qy 3316 AC T GC AT GAGAG TGGGGAT G T C AC AGAG TC C AGC C C ACC C T CC T GGT AGC AC T GAGAAGC 3375 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ACTGCATGAGAGTGGGGATGTCACAGAGTCCAGCCCACCC TCCTGGTAGCAC TGAGAAGC 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAACCAGGCAGTGAGGCC TTGGT C TGAGACAGTAT CC TCAGGT CACAGAGC AGAGGATG 3495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAACCAGGCAGTGAGGCC TTGGT C TGAGACAGTAT CC TCAGGT CACAGAGC AGAGGATG 240 

Qy 3496 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AGGAC AC AT AGGAC TC C AC AGAG T CTGGC C T C AC C T C C C T AC T GT C AGT C C T G TAGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
Db 301 C AGGAC AC AT AGGAC TC C AC AGAG T CTG GC C T C AC C T C C C T AC T GT CAGT C C T GTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 367 6 GGGAC AGGC C AAC C C AGAGGAC AG GAT T CC C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 3735 

I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 

Db 421 GGGACAGGCCAACCC AGAGGACAGGAT TCCC T GGAGGC CACAGAGGAGCACC AAGGAGAA 480 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 54 0 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GCCTGCTGCCCT GAC GAGAGT C AT C ATG TC T C T TGAGC AGAGGAGT C T GC AC TGC AAGC C 3915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 601 GCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCC 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 
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Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AGATCC T C C C C AGAG T C C T C AGGGAGC CTCCGCCTTTCCCAC TAG C ATC AAC T T C AC T CG 840 

Qy 4096 AC AGAGGC AAC C C AG T GAGGGT TC C AGC AGC C GTGAAGAG GAGGGGC C AAGC ACC T C T TG 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 841 AC AGAGGC AAC C C AG TGAGGGT TC C AGC AGC C GTGAAGAGGAGGGGC C AAGC AC C T C T TG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TC T GC TC C TCAAATATCGAGCC AGGGAGC CAGTC AC AAAGGC AG AAATGC TGGAGAGTGT 1020 

Qy 427 6 CAT C AAAAAT T AC AAGC AC TGT T T TCC T GAGATC T TCGGC AAAGCC TC TGAG TCC T TGC A 4335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CAT C AAAAAT T AC AAGC AC TGT T T T CC T GAGATC T T CGGC AAAGCC T C T GAG TC C T T GC A 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 C AC C T GC C T AGGT C T C TC C TAT GAT GGC C T GC T GGG TGAT AAT C AGAT C AT GC C C AAGAC 4455 

I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1141 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 1200 

Qy 4456 AGGCT TCC TGAT AAT TGTCCTGGTCATGAT TGC AAT GGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 1 I I I I I I I I I I I 
Db 1201 AGGCT TCC TGAT AAT TGTCCTGGTCATGAT TGC AATGGAGGGCGGCCATGCTCCTGAGGA 1260 

Qy 4 516 GGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTA 4 575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 GGAAAT C T GGGAGGAGC T GAGT GT GAT GGAGG T GT ATGAT GGGAGGGAGC AC AGT G C C T A 1320 

Qy 4 57 6 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACGG 4635 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1321 TGGGGAGC C C AGGAAGC TGC TC AC C CAAGAT T T GGT GCAGGAAAAGT AC C T G GAGT AC GG 1380 

Qy 4636 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 4695 

I IE I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCT 1440 

Qy 4 696 GAAAC C AGC T ATG TGAAAG T C C T T GAG T ATG T GAT C AAGG T C AG TGC AAGAG TTCGCTTT 4755 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTT 1500 

Qy 4756 T TC TTC C CAT C C C TGC GTGAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGT C T GAGC ATGA 4815 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 T TC TT C C CAT C C C TGC GTGAAGC AGC T T TGAGAGAGGAGGAAGAGGGAGT C T GAGC AT GA 1560 

Qy 4816 GTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCA 487 5 

I II I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 
Db 1561 GTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCA 1620 

Qy 4876 GCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCAG 4935 

I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1621 GC AGC T T C C C C T GCC T CGT G TGAC ATGAGGC C CAT TCTTCACTCT GAAGAGAGC GG T C AG 1680 
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Qy 4936 TGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTT 4995 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTT 1740 

Qy 4996 TTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTT 5055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 
Db 1741 TTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTT 1800 

Qy 5056 TATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTT 5115 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TAT GAAT GAC AGC AG TC AC AC AGT T C T G TGTAT AT AGT T T AAGGGTAAGAGT C T T G T GT T 1860 

Qy 5116 T TAT TCAGAT T GGGAAATC CAT TC TAT T TTGTGAAT TGGGATAATAAC AGCAGTGGAATA 5175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T TAT TCAGAT T GGGAAATC CAT TC TAT T TTGTGAAT TGGGATAATAAC AGC AGTGGAAT A 1920 

Qy 517 6 AGTACTTAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGATAAAGAACTAAAGAAATT 5235 

I I I I I I I I I I I I I 1 I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AG T AC T T AGAAAT G T GAAAAAT GAGC AG T AAAAT AG AT GAGAT AAAGAAC T AAAGAAAT T 1980 

Qy 5236 AAG AGAT AGTC AAT TCTTGCCT T AT ACC TC AGT C TAT T C T GTAAAAT T T T T AAAGAT AT A 5295 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1981 AAG AGAT AG TC AAT TCTTGCCT TAT ACC TC AGT C TAT TC T GTAAAAT T T T T AAAGAT AT A 2040 

Qy 5296 TGC AT AC C TGGAT T T C CT T GGC TT C T T T GAGAAT GT AAGAGAAAT T AAATC T GAAT AAAG 5355 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 T GC AT AC C TGGAT T T C C T T GGC TT C T T T GAGAAT GT AAGAGAAAT T AAATC T GAAT AAAG 2100 

Qy 5356 AATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAG 5415 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2101 AATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAG 2160 

Qy 5416 GCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTCG 5475 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTCG 2220 

Qy 5476 TAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAGG 5535 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 TAG AGT C T AGG AGC T GC AG TC ACG T AAT CGAGGT GGC AAGAT GT C C TC T AAAGAT G T AGG 2280 

Qy 5536 GAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 5595 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2281 GAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 2340 

Qy 5596 CCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGT 5655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGT 2400 

Qy 5656 AATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I 
Db 2401 AATGATCTTGGGTGGATCC 2419 
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APPLICANT: Bot, Adrian Ion 
APPLICANT: Liu , Xiping 

TITLE OF INVENTION: COMBINATIONS OF TUMOR- ASSOCIATED 

TITLE OF INVENTION: ANTIGENS IN COMPOSITIONS FOR VARIOUS TYPES OF CANCERS 
FILE REFERENCE: MANNK.04 9A 

CURRENT APPLICATION NUMBER: US/11/323,04 9 
CURRENT FILING DATE: 2005-12-29 
PRIOR APPLICATION NUMBER: 60/640,598 
PRIOR FILING DATE: 2004-12-29 
NUMBER OF SEQ ID NOS : 26 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 18 
LENGTH: 2420 
TYPE : DNA 

ORGANISM: Homo sapiens 
US-11-323-049-18 

Query Match 42.4%; Score 2408; DB 9; Length 2420; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 3256 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 60 

Qy 3316 AC T GC AT GAGAG TGGGGAT GTC AC AGAG T C C AGC C C AC C C TC C T GGT AGC AC T GAGAAGC 3375 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AC T GC AT GAGAGTGGGGAT GTC AC AGAG T C C AGC C C AC C C TC C T GGT AGC AC T GAGAAGC 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I II I I I 

Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAAC C AGGC AG T GAGGC C T T GGT C TGAGAC AGT AT C C T C AGGT C AC AGAGC AGAGGATG 3495 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GGAAC C AGGC AGT GAGGC C T T GGT C TGAGAC AGT AT C C T C AGG T C AC AGAGC AGAGGATG 240 

Qy 34 96 C AC AGGG T GT G CC AG CAGT GAAT GTTTGCCCT GAAT GC AC AC CAAGGG C C CC AC C T GC C A 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 
Db 241 CAC AGGG T GT GC C AG CAG T GAAT G T T TGC C C T GAAT GC AC AC CAAGGG C C CC AC C T GC C A 300 

Qy 3556 C AGGAC AC AT AGGAC T C CAC AGAG TCTGGCCT CAC C T C C C TAC T GTCAGT CC T G TAGAAT 3615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 C AGGAC AC AT AGGAC T C CAC AGAG T C TG GC C T CAC C T C C C TAC T GTC AGT CC T G TAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGGAC AG GC C AAC C C AGAGGAC AGGAT T C C C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 3735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 421 GGGACAGGCCAAC CC AGAGGACAGGATT CCCTGGAGGC CACAGAGGAGCACC AAGGAGAA 480 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 
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Qy 3856 GCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCC 3915 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCC 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 3976 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCC T C C CC AGAG T C C T C AGGGAGC CTCCGCCTT TC C C AC TAC CAT C AAC T T C AC TC G 4095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 781 AGATCC TCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCC AC TAC CAT CAACTTCACTCG 840 

Qy 4096 ACAGAGGCAAC CCAGTGAGGGT TCCAGC AGCC GTGAAGAGGAGGGGCC AAGC ACC T C TTG 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 ACAGAGGCAAC CCAGTGAGGGT TC CAGC AGCC GTGAAGAGGAGGGGC C AAGC ACC T C TTG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TC T GC T C C T C AAAT AT C GAGC C AGGGAGC C AG T C AC AAAGGC AGAAAT GC T GGAGAG TGT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TC T GC T C C TC AAAT AT C GAGC CAGGGAGC C AG T C AC AAAGGC AGAAAT GC T GGAGAGTG T 1020 

Qy 427 6 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4 335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CAT C AAAAAT TAC AAGC AC TGTTTTCCT GAGAT C T T C GGC AAAGC C TC TGAGT C C T T GC A 1080 

Qy 4336 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 4395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 4455 

I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 1200 

Qy 4456 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 1201 AGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGA 12 60 

Qy 4516 GGAAAT C T GGGAGGAGC TGAG TGT GAT GGAGG TG T AT GAT GGGAGGGAGC AC AG TG C C T A 4575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GGAAAT C T GGGAGGAGC TGAGTGT GAT GGAGG TGT AT GAT GGGAGGGAGC AC AG TG C C T A 1320 

Qy 4 57 6 TGGGGAG C C C AGGAAGC T GC T C AC C C AAGAT T T GGT GC AGGAAAAGTACC T GGAGT A- C G 4 634 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACCG 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TGAAAC C AGC T AT GT GAAAGTC C T TGAG TAT GT GAT C AAGGTC AGT GC AAGAGT TC GC T T 1500 

Qy 4755 TTTCTTCC CAT C C C T GC GT GAAGC AGC T TT GAGAGAGGAGGAAGAGGG AG T C T GAGC AT G 4814 
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1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1501 TTTCTTCC CAT C C C T GC GT GAAGC AGC T T TGAGAGAGGAGGAAG AGGGAG T C TGAGC ATG 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 4 934 

I I I I I I M II I I I I I I I I I I I II I I I I I I I I I I I II I I I II I I I I I I I I I I I I II I II II 
Db 1621 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 1680 

Qy 4 935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4 994 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4 995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 1860 

Qy 5115 T T TAT T C AGAT T GGGAAAT C CAT T C TAT T T TG TGAAT TGGGAT AAT AAC AGC AGT GGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T T TAT T C AGAT T GGGAAAT C CAT T C TAT T T TG T GAAT TGGGAT AAT AAC AGC AGTG GAAT 1920 

Qy 517 5 AAG T AC T TAGAAAT G TGAAAAAT GAGC AGT AAAAT AGATGAGAT AAAG AAC T AAAGAAAT 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAG TACT TAGAAAT G TGAAAAAT GAGC AGTAAAAT AGAT G AGAT AAAGAACT AAAGAAAT 1980 

Qy 5235 TAAGAGAT AGT C AAT T C T T GC C T TAT AC C TC AG T C TAT T C TGTAAAAT T T T T AAAGAT AT 5294 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 TAAGAGAT AGT C AAT TCTTGCCT TAT AC C T C AGTC T AT T C TGTAAAAT T T TT AAAGAT AT 2040 

Qy 52 95 ATG CAT AC C T GGAT T TC C T TGGC T T C T T TGAGAATG T AAGAGAAAT TAAATC T GAAT AAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 ATGC AT AC C TGGAT T TC C T TGGC T T C T T TGAGAATG T AAG AGAAATTAAATC T GAAT AAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 

Qy 5475 GTAGAGTC TAGGAGC TGCAGTCAC GTAATCGAGGTGGCAAGATGTCC TC TAAAGATGTAG 5534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GT AGAGT C TAGGAGC TGCAGTCAC GT AATC GAGG T GGC AAGAT G TCC T C T AAAGATG T AG 2280 

Qy 5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGAAAAG TGAGAGAGGGGT GAGGG T GT GGGGC TCC GGGT GAGAG T GG T GGAG T G TC AATG 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I II I I I I I I I I I 
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Db 2401 TAATGATCTTGGGTGGATCC 2420 


RESULT 4 
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Best Local Similarity 99.9%; Pred. No. 0; 
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Qy 3256 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 60 

Qy 3316 AC TGCATGAGAGTGGGGAT GTCAC AGAGTCCAGCCC AC CC TCC T GGTAGCAC TGAGAAGC 337 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AC T GC AT GAGAG TGGGGAT GTCAC AGAG TC C AGC C C AC CC T C C T GG T AGC AC TGAGAAGC 120 

Qy 337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 34 35 

I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 180 

Qy 3436 GGAACCAGGCAGTGAGGCC TTGGT C TGAGACAGTAT CC TC AGGT CACAGAGC AGAGGATG 3495 

I I I I I I I I I I I E I I I I I I I I I I I I I I E I I I I It I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAAC C AGGC AGTGAGGC C T TGGT C T GAGAC AGT AT C C TC AGGT CACAGAGC AGAGGAT G 240 

Qy 34 96 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AGGAC AC AT AGGAC TC C AC AGAG T C TGGC C T C ACC TCCC T AC T G T C AGT C C T GTAGAAT 3615 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CAGGACACATAGGACTCCACAGAGTCTGGCCTCACCTCCCTACTGTCAGTCCTGTAGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 3675 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 361 CGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTTTTCAG 420 

Qy 3676 GGGAC AGGC C AAC C C AGAGGAC AGGAT T C C C T GGAGGCC AC AGAGGAGC ACC AAGG AGAA 3735 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GGGAC AGGC C AAC C C AGAG GAC AG GAT T C C C T GGAGGC C AC AGAGGAGC AC C AAGGAGAA 480 

Qy 3736 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 3795 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 481 GATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTCA 540 

Qy 3796 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 3855 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCT 600 

Qy 3856 GCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCC 3915 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGCC 660 

Qy 3916 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 3975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCAC 720 

Qy 397 6 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 4 035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I I II I I I I I I I I I 
Db 721 CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAAC 780 

Qy 4036 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 4095 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 
Db 781 AGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTCG 840 

Qy 4096 AC AGAGGC AAC C C AGT GAG GG T T C C AGC AGC C GTGAAGAG GAGGGGC C AAGC AC C T C T TG 4155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AC AGAGGC AAC C C AGT GAG GGT T C CAGC AGC C G TGAAGAGGAGGGGC C AAGC AC C T C T TG 900 

Qy 4156 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 4215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTT 960 

Qy 4216 TCTGCTCC TC AAATAT CGAGC C AGGGAGC C AG TC AC AAAGGC AGAAAT GC T GGAGAGT GT 4275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TC T GC T C C TC AAATAT C GAGC C AGGGAGC C AG TC AC AAAGGC AGAAAT GC T GGAGAGT GT 1020 

Qy 4276 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 4 335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I- I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCA 1080 

Qy 4336 GC T GGT C T T TGGC AT T GAC G T GAAGGAAGC AGACC C C AC C GGC C AC T C C TAT GTC C T T GT 4395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGT 1140 

Qy 4396 CACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGAC 4455 

I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I 
Db 1141 C AC C TGC C T AGGT C T C T C C TAT GAT GGC C T GC T GGG TGAT AAT C AGAT C ATGC C C AAGAC 1200 

Qy 4456 AGGC TTCC TGAT AAT TGTCCTGGTCATGAT TGC AATGGAGGGCGGCC ATGC TCCTGAGGA 4515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGGC TTCC TGAT AAT TGTCCTGGTCATGAT TGC AATGGAGGGCGGCC ATGC TCCTGAGGA 1260 

Qy 4516 GGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTA 4575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1261 GGAAATC TGGGAGGAGC TG AGTGT GAT GGAGGT GTAT GAT GGGAGGGAGC AC AGTGC C T A 1320 

Qy 4 57 6 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CG 4 634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1321 TGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTACCG 1380 

Qy 4 635 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 4 694 

I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGC 1440 

Qy 4 695 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 4754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTT 1500 

Qy 4755 TTTCTTCC CAT C C C T GC GT GAAGC AGC T TTGAGAGAGGAGGAAGAGGGAGT C TGAGC AT G 4814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1501 TTTCTTCC CAT C CC T GCGT GAAGC AGC T TTGAGAGAGGAGGAAG AGGGAGTC T GAGC AT G 1560 

Qy 4815 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCC AGTGC ACCTTCCAGGGCCGCGTCC 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCC AGTGC ACCTTCCAGGGCCGCGTCC 1620 

Qy 4875 AGC AGC T TC C C C TGC C T C G T GT GAC AT GAGGC C CAT T C T T C AC T C T GAAGAGAGCGGT C A 4934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTCTGAAGAGAGCGGTCA 1680 

Qy 4935 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 4994 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCT 1740 

Qy 4 995 TTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGT 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 T T T GGAAT T GT T C AAAT GT T T T T T T TT AAGGGATGG T T GAAT GAAC T T C AGC ATC C AAG T 1800 

Qy 5055 TTATGAATGACAGCAGTCACACAGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGT 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 T T AT GAAT GAC AGC AGT C AC AC AG T TC T GTG T ATAT AGT T TAAGGGTAAGAGT C T T G T GT 18 60 

Qy 5115 T T T AT T C AGAT T GGGAAAT C CAT T C TAT TT T G T GAAT TGGGATAATAAC AGC AGT G GAAT 5174 

I i I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1861 T T TAT T C AGAT T GGGAAAT C CAT T C TAT T T T G T GAAT TGGGATAATAAC AGC AGT GGAAT 1920 

Qy 5175 AAGTAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGAT AAAGAAC T AAAGAAAT 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 AAGTAC T TAGAAATGTGAAAAATGAGCAGTAAAATAGATGAGAT AAAGAAC T AAAGAAAT 1980 

Qy 5235 T AAGAGATAGT C AAT T C T T GC C T TAT AC C TC AGTC TAT T C TGTAAAAT T T T T AAAGAT AT 52 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 T AAGAGATAGT C AAT T C T T GC C T TAT AC C TCAGTC TAT T C TGTAAAAT T T T T AAAGAT AT 2040 

Qy 5295 AT GC AT ACC T GGAT T T C C T T GGC T TCT T TGAGAAT G T AAGAGAAAT T AAATC T GAAT AAA 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 AT GCAT ACC TGGAT T T C C T T GGC T TCT T TGAGAAT G TAAGAGAAAT T AAATC T GAAT AAA 2100 

Qy 5355 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 5414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAA 2160 

Qy 5415 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 5474 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2161 GGCCCTGGGTTAGTAGTGGAGATGCTAAGGTAAGCCAGACTCATACCCACCCATAGGGTC 2220 
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Qy 5475 GTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAG 5534 

I I I I I I I I I ! I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I 
Db 2221 GTAGAGTCTAGGAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAAAGATGTAG 2280 

Qy 5535 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 5594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGAAAAGTGAGAGAGGGGTGAGGGTGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATG 2340 

Qy 5595 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 5654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCCTGAGCTGGGGCATTTTGGGCTTTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTG 2400 

Qy 5655 TAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I I I I I I I I 
Db 2401 TAATGATCTTGGGTGGATCC 242 0 
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Qy 1351 CCCATCGCCTCCCCCATTCTGGCAGAATCCGGTT-TGCCCCTGCTCTCAACCCAGGGAAG 1409 

I I I I I I I I I I I I I I It I I I I I I I I I I I III Ml I I I I I I I I I I I I I 

Db 1 C C C ATC C AGAT C C C C AT C C GGGC AGAAT CC GGT T CC AC C C T TGC C GT GAAC C C AGGGAAG 60 

Qy 1410 C C C TGGT AGGC CC GAT GT GAAACC AC TGAC T T GAAC C TC AC AGAT C T GAGAGAAGC C AGG 14 69 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TCACGG — GC C C GGAT G T GAC GCC AC TGAC T T G C AC AT TGG AGGT C AGAGGAC AGC GAGA 118 

Qy 1470 TTCATTTAATGGTTCTGAGGGGCGGCTTGAGATCCACTGAGGGGAGTGGTTTTAGGCTCT 1529 

III II I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 119 TTC TCGCCCTGAGCAACGGCCTGACGTCGGCGGAGGGAAGCAGGCGCAGGCTCC 172 

Qy 1530 GTGAGGAGGCAAGGTGAGATGC TGAGGGAGGAC TGAGGAGGCAC ACAC CCCAGGTAGATG 1589 

I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I II I I I I I I I I I III I 
Db 17 3 GTGAGGAGGC AAGGT AAGACGC CGAGGGAGGAC T GAGGC G GGC C T C AC C C C AGAC AGAGG 232 

Qy 1590 GCCCCAAAATGATCCAGTACCACCCCTGCTGCCAGCCCTGGACCACCCGGCCAGGACAGA 1649 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 233 GCCCCCAATTAATCCAGCGCTGCCTCTGCTGCCGGGCCTGGACCACCCTGCAGGGGAAGA 2 92 

Qy 1650 TGTCTCAG CTGGACCACCCCCCGTCCCGTCCCACTGCCACTTAACCCACAGGG 1702 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I 1 I I I I I 

Db 293 CTTCTCAGGCTCAGTCGCCACCACCTCACCCCGCCACCCCCCGCCGCTTTAACCGCAGGG 352 

Qy 1703 CAATCTGTAGTCATAGCTTA-TGTGACCGGGGCAGGGTTGGTCAGGAGAGGCAGGGCCCA 17 61 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 353 AACTCTGGCGTAAGAGCTTTGTGTGACCAGGGCAGGGCTGGTTAGAAGTGC 403 

Qy 1762 GGCATCAAGGTCCAGCATCCGCCCGGCATTAGGGTCAGGACCCTGGGAGGGAACTGAGGG 1821 

III II I I I I II III II II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 404 TCAGGGCCCAGACTCAGCCAGGAATCAAGGTCAGGACCCCAAGAGGGGACTGAGGG 4 59 

Qy 1822 TTCCCCACCCACACCTGTCTCCTCATCTCC 1851 

I I I I I I I I I III I III 
Db 4 60 CAACCCACCCCCTACCCTCACTACCAATCCCATCCCCCAACACCAACCCCACCCCCATCC 519 

Qy 1852 ACCGCCACCCCACTCACATTCCCATACCTACCCCCTACCCCCAACCTCATCTTGT 1906 

II I I I I I I I I I I I III I II I I I I I I I I I I I I I 

Db 520 CTCAAACACCAACCCCACCCCCAAACCCCATTCCCATCTCCTCCCCCACCACCATCCTGG 579 

Qy 1907 CAGAAT CCCTGCTGTCAACCCACGGAAGCCACGGGAATGGCGGCCAGGCA 1956 
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I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 580 CAGAAT C C GGC TTTGCCCC TGC AAT C AAC C C AC GGAAGC T CC GGGAAT GGCGGC C AAGC A 639 

Qy 1957 CTCGGATCTTGACGTCCCCATCCAGGGTCTGATGGAGGGAAGGGG CTTGAAC 2008 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 640 CGCGGATCCTGACGTTCACATGTACGG-CTAAGGGAGGGAAGGGGTTGGGTCTCGTGAGT 698 

Qy 2009 AGGGCC T C AGGGGAGCAGAGGGAGGGC C C T AC TGC GAG AT GAGGGAGG C C TC AGA 2063 

I I I I I I III I I I I I II I I I I I I I I I I I III I I II I I I I I 

Db 699 ATGGCCTTTGGGATGCAGAGGAAGGGCCCAGGCCTCCTGGAAGACAGTGGAGTCCTTAGG 758 

Qy 2064 GG AC C C AGC AC C C T AGGA C AC CG C AC C C C TG TC TGAGAC TGAG GC T GC C AC 2114 

I I I II I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I 

Db 759 GGACCCAGCATGCCAGGACAGGGGGCCCACTGTACCCCTGTCTCAAACTGAGCCACCTTT 818 

Qy 2115 TTCTGGCCTCAAGAATCAGAACGATGGGGACTCAGATTGCATGGGGGTGGGACCCAGGCC 2174 

I I III I II I I I I I I I I I I I I I I I I I I I 

Db 819 TCATTCAGCCGAGGGAATCCTAGGGATGCAGACCCACTTCAGGGGGTTGGGGCCCAGCCT 878 

Qy 2175 TGC AAGGC T TACGC GGAGGAAGAGGAGGGAGGAC TC AGGGGACC T TGGAATC CAGATC AG 2234 

I I I I I I I M I I I I I I I I II I I I II I II I I I II I I I I I I I I I I I I I I I I 
Db 879 GCGAGGAGTCAAGGGGAGGAAGAAGAGGGAGGACTGAGGGGACC T TGGAGTC CAGATCAG 938 

Qy 2235 TGTGGACCTCGGCCCTGAGAGGTCCAGGGCACGGTGGCCACATATGGCCCATATTTCCTG 22 94 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 939 TGGCAACCTTGG-GCTGGGGGATCCTGGGCACAGTGGCCGAATGTGCCCCGTGCTCATTG 997 

Qy 2295 CATCTTTGAGGTGAC AGGAC AGAGC TGT GGT C T GAGAAGT GGGGC C T C AGGT C AAC 2350 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 998 CAC C T TC AGGG TGAC AGAGAGT T GAGGG C TGT GGT C T GAGGGC T GGGAC T T C AGGT C AGC 1057 

Qy 2351 AGAGGGAGGAGTTCCAGGATCCATATGGCCCAAGATGTGCCCCCTTCATGAGGACTGGGG 2410 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1058 AGAGGGAGGAATC C C AGGAT C T GC C GGAC C CAAGGT GTGC CC C C T TC AT GAGGAC T C C C C 1117 

Qy 2411 ATATCCCCGGCTCAGAAAGAAGGGACTCCACACAGTCTGGCTGTCCCCTTTTAGTAGCTC 2470 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I 

Db 1118 AT AC C CC C GGC C CAGAAAGAAGGG ATGC C AC AGAGT C TGGAAGT AAAT TGT T C T T AGC TC 1177 

Qy 2471 TAGGGGG AC CAGATC AGGGATGGCGGTATGTTCCATTCTC AC TTGTACCACAGGCAGGAA 2530 

I MM III M I I I I II I I I I I II II II I I I I I II I I I II II I I I II I I I 

Db 1178 TGG GGGAAC C T GAT C AGGGATGGC C C T AAG TGAC AAT C T C AT T T G T AC C AC AGGC AGGAG 1237 

Qy 2531 GTTGGGGGGCCCTCAGGGAGATGGGGTCTTGGGGTAAAGGGGGGATGTCTACTCATGTCA 2590 

I I I I II I I I II I I II II I I I III I I II I I I II I II I I II I I I I I II II I 
Db 1238 GTTGGGGAACCCTCAGGGAGATAAGGTGTTGGTGTAAAGAGGAGCTGTCTGCTCATTTCA 1297 

Qy 2591 GGGAAT T GGGGGT T GAGGAAGC AC AGGC GC TGGC AGGAAT AAAGAT GAGT GAGAC AGAC A 2650 

III II II I I I II I I I I I I I I I I I I II I I I I I I I I I I I I III 

Db 1298 GGGGGT T C C C C C T T GAGAAAGGGC AGT C C C TGGC AGGAGT AAAGAT GAGT AAC C C AC AGG 1357 

Qy 2651 AGGC TAT TGGAATCCACACCCCAGAACCAAAGGGGTCAGCCCTGGACACCTCACCCAGGA 2710 

I I I I II II I II I I I I M M I II I I II I II I II I II II I I I I M II 

Db 1358 AGGCCATCATAACGTTCACCCTAGAACCAAAGGGGTCAGCCCTGGACAACGCACGTGGGG 1417 

Qy 2711 T GTGGCTTCTTTTTCACTCCTGTTTCCAGATCTGGGGCAGGTGAGGACCTCAT 2763 

I I II I I I I I I I II I I I M I I I I I II II I I I II I I 

Db 1418 TAAC AGGATGT GGC C C C TC C TC AC TTGTCTTTC C AGAT C T C AGGGAGT T GAT GAC C T T GT 1477 

Qy 2764 TC T C AGAGGGT GAC T C AGG TC AAC GTAGGGAC C C C C AT C T GGT C TAAAGAC AGAGC GG TC 2823 

I I II I I I I I I I I I I I I I III I M I II I I I I I I I I I I II I 
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Db 1478 T T T C AGAAGGT GAC T C AGT C AAC AC AGGGG CCCCTCTGGTCGACAGATGCAGTGGTT 1534 

Qy 2824 CC AGGAT C TGC C AT GC GT T CGGGT GAGGAAC ATGAGGGAGGAC T GAGGGTAC C CC AGGAC 2883 

I II I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I II I I I I I I I II I 
Db 1535 C T AGGAT C TGC C AAGC ATC C AGGT GGAG AGC C TGAGGT AGGAT T GAGGGTAC C C C T GGGC 1594 

Qy 2884 C AG AAC AC T G - AGGGAGAC T GC AC AGAAAT C AGC CCTGCCCCTGC TGTC AC CC C AGAGAG 2942 

Mill I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1595 CAGAATGC AGC AAGG GGGC C C CAT AGAAATC T GC C C T GCC C C TGC GG T T AC T TC AGAGAC 1654 

Qy 2943 CATGGGCTGGGCCGTCTGCCGAGGTCCTTCCGTTATCCTGGGATCATTGATGTCAGGGAC 3002 

I I I I I I I I I I III II I I MM III I I II M II I I I I I II II I II I I II I 
Db 1655 CCTGGGCAGGGCTGTCAGCTGAAGTCCCTCCATTAT-CTGGGATCTTTGATGTCAGGGAA 1713 

Qy 3003 GGGGAGGCCTTGGTCTGAGAAGGCTGCGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCCCT 3062 

I II I I I M I I I I I I I I I I I II I I II I I M I I I I I I II I M I III II I II M I 

Db 1714 GGGGAGGCCTTGGTCTGAAGGGGCTGGAGTCAGGTCAGTAGAGGGAGGGTCTCAGGCCCT 1773 

Qy 3063 GC C AGGAGTC AAGG T GAGGAC C AAGCGGGC AC C T C AC C C AGGAC AC AT T AAT T C C AAT GA 3122 

II I I M II I I I I II I II II M I I I I I I II I II I I II I II I I I II I II II I 

Db 1774 GCCAGGAGTGGACGTGAGGACCAAGCGGACTCGTCACCCAGGACACCTGGACTCCAATGA 1833 

Qy 312 3 ATTTTGATATCTCTTGCTGCCCTTCCCCAAGGACCTAGGCACGTGTGGCCAGATGTTTGT 3182 

I I I II I I I I I II I I I I I I II I II I I II I I I II II I II M II II I I II 

Db 1834 A-TTTGACATCTCTCGTTGTCCTTCGCGGAGGACCTGGTCACGTATGGCCAGATGTGGGT 1892 

Qy 3183 CCCCTC-CTGTCCTTCCATTCCTTATCATGGATGTGAACTCTTG — ATTTGGATTTCTCA 3239 

II I I II I I I M I I I I I II I M II I I II M I I I II M I MUM 

Db 1893 CCCCTCTATCTCCTTCTGTACCATATCAGGGATGTGAGTTCTTGACATGAGAGATTCTCA 1952 

Qy 3240 GAC C AGC AAAAGGGC AGGAT CCAGGCC C TGC C AGGAAAAAT ATAAGGGC C C T GC GT GAGA 32 99 

I II I I M M I II II I I II I I M I I I II I III I II II M II I I I II I 

Db 1953 AGC C AGC AAAAGGGT GGGAT - TAGGC C C T AC AAGGAGAAAGG TGAG GGC C C TGAGT GAGC 2011 

Qy 3300 AC AGAGGGGG T CAT C C AC T GC AT GAGAG TGGGGAT G T C AC AGAG T C C AGC C C AC CC T C C T 3359 

II II I II II I I I I II I I I II II II I I II II II I II II I II I M II 

Db 2012 AC AGAGGGGAC C C T C C AC C CAAGT AGAG TGGGGAC C T C AC GGAG T C T GGC CAAC CC T GC T 2071 

Qy 3360 GGTAGCACTGAGAAGCCAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCC 3419 

I I I II III II II I II I I M II I I II I II I I I II I II I II I II I I I II 

Db 2072 GAGACTTCTGGGAATCCGTGGCTGTGCTTGCAGTCTGCACACTGAAGGCCCGTGCATTCC 2131 

Qy 3420 TCTTCCT GGAGC T C C AGGAAC C AGGC AG T GAGGC C T T GG T C T GAG AC AG TAT C 3472 

III II I I I I I II I II I I II II II I II M II I I I I I II II I II I II I I I 

Db 2132 T C TC C C AGGAATC AGGAGC T C C AGGAAC C AGGC AG T GAGGC C T T GG T C TGAG T C AG T - GC 2190 

Qy 3473 CTCAGGTCACAGAGCAGAGGATGCACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATG 3532 

M I II I I II II I II I I I I I I I I II I I II I I II I II I I I I II I I I II I I 
Db 2191 C T C AGG T C AC AGAGC AGAGGGGAC GC AG AC AG T GC CAAC AC T GAAGGT T T GC C T GGAAT G 22 50 

Qy 3533 C AC AC C AAGGG C CCC AC C T GC C AC AGGAC AC AT AGG AC TC C AC AGAG T C T GGC C TC A- C C 35 91 

II I I I I II I I I II M I II III Ml III II II II II II II I II I I I I II I II 

Db 2251 CACACCAAGGGCCCCACCCGCC-CAGAACAAATGGGACTCCAGAGGGCCTGGCCTCACCC 2309 

Qy 3592 TCCCTACTGTCAGTCCTGTAGAATCGACCTCTGCTGGCCGGCTGTACCCTGA-GTACCCT 3650 

II II I I I II II M I I I II I I I II II II II II I II I II II II I M II II 
Db 2310 TCCCTATTCTCAGTCCTGCAGCCTGAGCATGTGCTGGCCGGCTGTACCCTGAGGTGCCCT 2369 

Qy 3651 C T C AC T T C C T C C T TC AGGT T T TC A- GGGGAC AGGC C AACC C AGAGGAC AG GAT T C C C T GG 3709 

I I II II I II I I I II II II I I I I II I I II I II II Mill II I I II I 

Db 2370 C C C AC T T C C TC C TTC AGGT T C TGAGGGGGAC AGGC T GAC AAG TAGGAC CC GAGGC AC TGG 2429 
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Qy 3710 AGGCCACAGAGGAGCACCAAGGAGAAGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAG 3769 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2430 AGGAGCATTG AAGGAGAAGATCTGTAAGTAAGCCTTTGTCAGAGCCTCCAAG 2481 

Qy 3770 GTTCAG TTCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGG 3824 

I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2482 GTTCAGTTCAGTTCTCACCTAAGGCCTCACACACGCTCCTTCTCTCCCCAGGCCTGTGGG 2541 

Qy 3825 TCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGT 3884 

' I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2542 TCTTCATTGCCCAGCTCCTGCCCGCACTCCTGCCTGCTGCCCTGACCAGAGTCATCATGC 2601 

Qy 3885 C T C T T GAGC AGAGGAGT C T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGG 3944 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2602 C TC TTGAGCAGAGGAGTCAGCAC T GCAAGCC TGAAGAAGGCC T TGAGGCCCGAGGAGAGG 2661 

Qy 3945 CCCTGGGCCTGGTGTGTGTGCAGGCT GCCACCTCCTCCT 3983 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2662 CCCTGGGCCTGGTGGGTGCGCAGGCTCCTGCTACTGAGGAGCAGCAGACCGCTTCTTCCT 2721 

Qy 3984 CCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTC 4043 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2722 CTTCTACTCTAGTGGAAGTTACCCTGGGGGAGGTGCCTGCTGCCGACTCACCGAGTCCTC 2781 

Qy 4044 C C C AGAG TC C T C AGGGAGC CTCCGCCTT TC C C AC T AC CAT C AAC T TC AC T C GAC AG AGGC 4103 

I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I III I 

Db 2782 C C C AC AG TC C T C AGGGAGC C TC C AGC T T C T C GAC TAC CAT C AAC T AC AC T C T T T GG AGAC 2841 

Qy 4104 AAC CCAGTGAGGGTTCCAGCAGCCGTGAAGAGGAGGGGCC AAGC ACCTCTTGTATCCTGG 4163 

I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I || | | M I 

Db 2842 AAT C C GAT GAGGGC T C C AGC AAC C AAGAAGAGGAGGGGC C AAGAAT G T T T C C C GAC C TGG 2 901 

Qy 4164 AGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCC 4223 

I I I I I I I I I I I I I I I I I I I I II I I I I III III I I I I I I I I I I I I I I I I I 
Db 2 902 AGTCCGAGTTCCAAGCAGCAATCAGTAGGAAGATGGTTGAGTTGGTTCATTTTCTGCTCC 2 961 

Qy 4224 T C AAAT AT C GAGC C AGGGAGC C AG TC AC AAAGGC AGAAAT GC TG GAGAGT GT C AT C AAAA 4283 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II 
Db 2 962 TC AAGT AT C GAGC C AGGGAGC C GG TC AC AAAGGC AGAAAT GC T G GAGAGT GT C C T C AGAA 3021 

Qy 4284 AT TAC AAGC AC TGTTTTCCT GAGATC T T CGGC AAAG C C T C TGAG T C C T TGC AGC T GG TC T 4343 

III I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3022 ATTGCCAGGACTTCTTTCCCGTGATCTTCAGCAAAGCCTCCGAGTACTTGCAGCTGGTCT 3081 

Qy 4344 T TGGC AT TGAC GT GAAGGAAGC AGACC C C AC C GGC C AC T C C TAT GTCCTTGT C AC C T GC C 4403 

I I I I I I I II III I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 3082 TTGGCATCGAGGTGGTGGAAGTGGTCCCCATCAGCCACTTGTACATCCTTGTCACCTGCC 3141 

Qy 4404 TAGGTCTCTCCTATGATGGCC TGC TGGGTGATAATCAGATCATGCCCAAGAC AGGC TTCC 4463 

I II I II I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I III 
Db 3142 TGGGCCTCTCCTACGATGGCCTGCTGGGCGACAATCAGGTCATGCCCAAGACAGGCCTCC 3201 

Qy 4464 TGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGGAGGAAATCT 4 523 

I I I I I I I I I I I I I I III II I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
Db 3202 TGATAATCGTCCTGGCCATAATCGCAATAGAGGGCGACTGTGCCCCTGAGGAGAAAATCT 32 61 

Qy 4524 GGGAGGAGC TGAGTGTGAT GGAGG TGTATGATGGGAGGGAGCAC AGTGCC TATGGGGAGC 4583 

I I I I I I I I I I I I I I II I I I I I I I I I III I I I I I I I I I I I I I I I II I I I 
Db 3262 GGGAGGAGC TGAGTATGTT GGAGG TGT T TGAGGGGAGGGAGGAC AGTGTC TTCGC ACATC 3321 
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Qy 4 584 CCAGGAAGCTGCTCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGC 4 642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3322 CCAGGAAGCTGCTCATGCAAGATCTGGTGCAGGAAAACTACCTGGAGTACCGGCAGGTGC 3381 

Qy 4 64 3 CGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCA 4702 

I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3382 CCGGCAGTGATCCTGCATGCTACGAGTTCCTGTGGGGTCCAAGGGCCCTCATTGAAACCA 34 41 

Qy 4 703 GCTATGTGAAAGTCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCC 4 7 62 

I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 3442 GCTATGTGAAAGTCCTGCACCATACACTAAAGATCGGTGGAGAACCTCACATTTCCTACC 3501 

Qy 4763 CATCCC TGCGT GAAGCAGC TT TGAGAGAGGAGGAAGAGGGAGTC TGAGCATGAGTT GCAG 4822 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 3502 C AC C C C T GC AT GAAC GGGC TT T GAGAGAGGGAGAAGAGT GAGT C T C AGC AC AT GT T GCAG 3561 

Qy 4823 CCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTT 4882 

III I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3562 CCAGGGCCAGTGGGAGGGGGTCTGGGCCAGTGCACCTTCCAGGGCCCCATCCATTAGCTT 3621 

Qy 4883 CCCCTGCCTCGTGTGACATGAGGCCCATTCTT — C AC TC T GAAGAGAGCGG TC AG T GT T C 4 940 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I III 

Db 3622 C C AC TGC C T C G T GTGATAT GAGGC C CAT TCCTGCCTCTTT GAAGAGAGC AGTC AGC AT TC 3681 

Qy 4 941 TCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGA 5000 

I II Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 
Db 3682 TTAGCAGTGAGTTTCTGTTCTGTTGGATGACTTTGAGATTTATCTTTCTTTCCTGTTGGA 3741 

Qy 5001 AT T GT TC AAAT GT t T T T T T T T AAG GGAT GGT T GAAT GAAC T T C AGC AT CC AAGT T T AT GA 5060 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3742 AT T GT TC AAAT G- T T C C T T T T AACAAAT GG T T GGAT GAAC T T C AGC AT CC AAGT T TAT G A 3800 

Qy 5061 AT G AC AGC AGT C AC AC — AGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTA 5118 

I 11 I I II I I I I I I I I III MM I I I II I I II I I II I I I I I I I II III I I I I I 
Db 3801 AT GAC AG TAGT C AC AC ATAGT GC T G T T TAT AT AG T T T AGGGGTAAGAG TC C T GT T T T T TA 38 60 

Qy 5119 T T C AGAT TGGGAAAT C CAT TC TAT T T T G T GAAT T G - - GGATAAT AAC AGC AGT G GAAT AA 5176 

I I I I I I I I II I II I I I I II I I II I I I I I I I III I I I I I I I M I I M I II I I II 

Db 3861 T T C AGAT TGGGAAAT C CAT TC CAT T T T G TGAG T TGT C AC AT AAT AAC AGC AGTGGAAT AT 3920 

Qy 5177 G T AC T T AGAAAT GT G AAAAATGAGC AG T AAAAT AG AT GAGAT AAAGAAC T AAAGAA 5232 

I II II III I II I I I I I II I I I I I I I II I I II I II I 

Db 3921 GT AT T T GC C TAT AT T GT GAAC GAAT T AGC AGT AAAAT AC AT GAT AC AAGGAAC 3973 

Qy 5233 AT TAAGAGAT AGTC AAT TC T T GC C T TAT AC C T C AGT C TAT T C T G TAAAAT T T T T AAAGAT 52 92 

I II I II I I I M I I I I I I M I I I I I I I II I I I I I II I I I I I I I I I I II I I II 
Db 3974 -TCAAAAGATAGTTAATTCTTGCCTTATACCTCAGTCTATTATGTAAAA TTAAAAAT 4029 

Qy 5293 AT AT GC AT AC C TGGAT T TC C T T GGC T T C T T T GAG AAT GTAAGAG AAAT T AAAT C T GAAT A 5352 

II II I I II I II I I II II I I I I I I II II I I II II I I I II I II I I 

Db 4030 ATGTGTA TGTTTTTGCTTCTT TGAGAAT GC AAAAGAAAT T AAATC T GAAT A 4080 

Qy 5353 AAGAATTCTTCCTGTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGG 5412 

I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I I II I I M I I M II I III 
Db 4081 AATTCTTCCTGTTCACTGGCTCATTTCTTTACCATTCACTCAGCATCTGCTCTGTGG 4137 

Qy 5413 AAGGCCCTGG 5422 

I M I II I II I 
Db 4138 AAGGCCCTGG 4147 
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RESULT 6 

US-11-323-049-19 

Sequence 19, Application US/11323049 
Publication No. US20060159694A1 
GENERAL INFORMATION: 
APPLICANT: Chiang, Chih-Sheng 
APPLICANT: Simard, John J.L. 
APPLICANT: Diamond, David C. 
APPLICANT: Bot, Adrian Ion 
APPLICANT: Liu , Xiping 

TITLE OF INVENTION: COMBINATIONS OF TUMOR- ASSOCIATED 

TITLE OF INVENTION: ANTIGENS IN COMPOSITIONS FOR VARIOUS TYPES OF CANCERS 
FILE REFERENCE: MANNK.04 9A 

CURRENT APPLICATION NUMBER: US/11/323,049 
CURRENT FILING DATE: 2005-12-29 
PRIOR APPLICATION NUMBER: 60/640,598 
PRIOR FILING DATE: 2004-12-29 
NUMBER OF SEQ ID NOS : 26 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 19 
LENGTH: 4204 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-11-323-049-19 

Query Match 31.1%; Score 17 62.6; DB 9; Length 4204; 

Best Local Similarity 81.0%; Pred. No. 0; 

Matches 2315; Conservative 0; Mismatches 4 74; Indels 68; Gaps 20; 

Qy 2790 AGGGACCCCCATCTGGTCTAAAGACAGAGCGGTCCCAGGATCTGCCATGCGTTCGGGTGA 2849 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1365 AGGGGCCCCTATGTGGTGGACAGATGCAGTGGTCCTAGGATCTGCCAAGCATCCAGGTGA 1424 

Qy 2850 GGAAC AT GAGG GAGG AC T G AGGGT AC C C C AGGAC C AGAAC AC T GA- GGGAGAC T GC AC AG 2908 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I III I I I I III 
Db 1425 AGAGAC T GAGGGAGGAT TGAGGGT ACC C C T GGGAC AGAAT GCGGAC TGGGGG C C C C ATAA 1484 

Qy 2909 AAATCAGCCCTGCCCCTGCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAGGTC 2968 

I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I II III II I I I I I I 
Db 1485 AAATCTGCCCTGCTCCTGCTGTTACCTCAGAGAGCCTGGGCAGGGCTGTCAGCTGAGGTC 1544 

Qy 2969 C T T CC GT TAT C C T GGGATC AT T GAT GTC AGGGAC GG GGAGGC C T TGGT C TGAGAAGGC TG 3028 

I III I I I I I IE I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I 
Db 1545 CCTCCATTATCCTAGGATCACTGATGTCAGGGAAGGGGAAGCCTTGGTCTGAGGGGGCTG 1604 

Qy 302 9 CGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCCCTGCCAGGAGTCAAGGTGAGGACCAAGC 3088 

I I I I I I I I I I I I I I I I I I I II III I I I I i I I I I I I I I I I I I I I I I I I I I I 
Db 1605 CAC TCAGGGC AGTAGAGGGAGGCT C TC AGACC C TAC TAGGAGTGGAGGTGAGGACC AAGC 1664 

Qy 308 9 GGGCACCTCACCCAGGACACATTAATTCCAATGAATTTTGATATCTCTTGCTG-CCCTTC 3147 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1665 AGTCTCCTCACCCAGGGTACATGGACTTCAATAAATTTGGACATCTCTCGTTGTCCTTTC 1724 

Qy 3148 CCCAAGGACCTAGGCACGTGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCTTAT 3207 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III I I I I I I 
Db 1725 CGGGAGGACCTGGGAATGTATGGCCAGATGTGGGTCCCCTCATGTTTTTCTGTACCATAT 1784 

Qy 3208 CAT GGAT G T GAAC TC T TG — ATTTGGATTTCTCAGACCAGCAAAAGGGCAGGATCCAGGC 32 65 

I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1785 C AG GT AT GTGAGT T C T TGAC AT GAGAGAT TC T C AGGCCAG C AGAAGGGAGGG AT - T AGGC 184 3 
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Qy 3266 C C T GC C AGGAAAAAT AT AAGGGCC C TGC GTGAGAAC AGAGGGGG TC AT C C AC TGC ATGAG 3325 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II II 
Db 1844 CC T ATAAGGAGAAAGGTGAGGGCC C TGAGTGAGCAC AGAGGGGATCC TC CACCCCAGTAG 1903 

Qy 3326 AGTGGGGATGTCACAGAGTCCAGCCCACCCTCCTGGTAGCACTGAGAAGCCAGGGCTGTG 3385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I 

Db 1904 AGT GGGGAC C T C AC AGAG T C TGGC C AAC C C TC C T GAC AG T T C T GGGAAT C C GTGGC T GC G 1963 

Qy 338 6 CTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTC C T GGAGC T C CAGGA 34 38 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1964 TTTGCTGTCTGCACATTGGGGGCCCGTGGATTCCTCTCCCAGGAATCAGGAGCTCCAGGA 2023 

Qy 3439 ACCAGGCAGTGAGGCCTTGGTCTGAGACAGTATCCTCAGGTCACAGAGCAGAGGATGCAC 34 98 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 2024 ACAAGGCAGTGAGGACTTGGTCTGAGGCAGTGTCCTCAGGTCACAGAGTAGAGGGGGCTC 2083 

Qy 3499 AGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAG 3558 

II I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I III 

Db 2084 AGATAGT GC C AAC GG T GAAGGT T T GC C T T GGAT TC AAAC C AAGGGC C C C AC C TGC C C C AG 2143 

Qy 3559 GACACATAGGACTCCACAGAGTCTGGCCTCA-CCTCCCTACTGTCAGTCCTGTAGAATCG 3617 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 2144 AACACAT-GGACTCCAGAGCGCCTGGCCTCACCCTCAATACTTTCAGTCCTGCAGCCTCA 2202 

Qy 3 618 ACCTCTGCTGGCCGGCTGTACCCTGA-GTACCCTCTCACTTCCTCCTTCAGGTTTTCAGG 367 6 

I I I I I I I I I I I I I I I I 1 I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 2203 GCATGCGCTGGCCGGATGTACCCTGAGGTGCCCTCTCACTTCCTCCTTCAGGTTCTGAGG 22 62 

Qy 3677 GGAC AGGC C AAC C C AGAGGAC AGGAT TC CC T GGAGGC C AC AGAGGAGC ACC AAGGAGAAG 3736 

I I I I I I I I III I I I I I I II III I I II I I I I I I I I I I 

Db 2263 GGAC AGGC T GAC C T GG AGG AC C AG AGGC C C C C GGAG G AGC AC T G AAGGAGAAG 2315 

Qy 3737 AT C T GT AAGT AGGC C T T T G T T AGAGTC T C C AAGG TTCAGTTCTCAGCTGAGGCCT 3791 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2316 AT C T GTAAG TAAGC C T T T G T T AGAGC C T C C AAGGT T C CAT TC AG T AC T C AGC TGAG GT C T 2375 

Qy 37 92 CTCACACACTCCCTCTCTC'CCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACAC 3851 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2376 CTCACATGCTCCCTCTCTCCCCAGGCCAGTGGGTCTCCATTGCCCAGCTCCTGCCCACAC 2435 

Qy 3852 TC C T GC C T GC T GC CC T GAC GAGAG TC AT C ATG T C T C T TGAGC AG AGGAGT C TGC AC T GCA 3911 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2436 TCCCGCCTGTTGCCCTGACCAGAGTCATCATGCCTCTTGAGCAGAGGAGTCAGCACTGCA 2495 

Qy 3912 AGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCT- 3970 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I 
Db 24 96 AGCCTGAAGAAGGCCTTGAGGCCCGAGGAGAGGCCCTGGGCCTGGTGGGTGCGCAGGCTC 2555 

Qy 3971 GCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGG 4010 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2556 C TGC TAC TGAGGAGC AGGAGGC TGCC TCCTCCTCTTC T AC T C T AGT TGAAGTC ACC C TGG 2615 

Qy 4011 AGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCT 4070 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 616 GGGAGGTGCCTGCTGCCGAGTCACCAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCAGCC 2 67 5 

Qy 4071 T T C C C AC T ACC ATC AAC T T C AC TC GAC AGAGG C AAC C C AG TGAGGGT T CC AGC AGC C GTG 4130 

I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2676 TC C C C AC T AC C ATGAAC TAC CC TC T C T GGAGC C AAT C C T ATGAGGAC T C C AGC AAC C AAG 2735 

Qy 4131 AAG AGGAGGGGC C AAGC AC C TC T T GT AT C C TG GAGT C CTTGTTCC GAGC AGT AATC AC T A 4190 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 

Db 2736 AAGAGGAGGGGC C AAGC AC C T TCC C TGAC C TG GAG T CC GAGT TC C AAG C AGC AC T C AGT A 2795 

Qy 4191 AGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCA 4250 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2796 GGAAGGTGGCCGAGTTGGTTCATTTTCTGCTCCTCAAGTATCGAGCCAGGGAGCCGGTCA 2855 

Qy 4251 C AAAGGC AGAAATGC TGGAGAGTG T CAT C AAAAAT T AC AAGC AC TGTTTTCCT GAG AT C T 4310 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I 

Db 2856 CAAAGGCAGAAATGCTGGGGAGTGTCGTCGGAAATTGGCAGTATTTCTTTCCTGTGATCT 2915 

Qy 4311 TCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACC 4370 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I 

Db 2916 TCAGCAAAGCTTCCAGTTCCTTGCAGCTGGTCTTTGGCATCGAGCTGATGGAAGTGGACC 2975 

Qy 4371 CCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGG 4430 

III I I I I I I I I II II III I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 2 97 6 CCATCGGCCACTTGTACATCTTTGCCACCTGCCTGGGCCTCTCCTACGATGGCCTGCTGG 3035 

Qy 4431 GTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAA 4490 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II I I I I 
Db 3036 GTGACAATCAGATCATGCCCAAGGCAGGCCTCCTGATAATCGTCCTGGCCATAATCGCAA 3095 

Qy 4491 TGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGT 4550 

I I I I I I I I ill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3096 GAGAGGGC GAC TGTGCCCC TGAGGAGAAAAT C T GGG AGGAGC T GAGT G TG T T AGAGGT GT 3155 

Qy 4551 AT GAT GGGAGG GAGC AC AG TGC C T ATGGGGAGC C C AGGAAGC T GC T C AC C C AAGAT T T GG 4610 

Ell I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3156 T TGAGGGGAGG GAAG AC AG TAT C T T GGGGGAT C C CAAGAAGC T GC T C AC C C AAC AT T T C G 3215 

Qy 4 611 T GC AGGAAAAG TAC C T GGAGTA- C GGC AGG T GCC GGAC AG TGAT C C C GC AC GC TAT GAGT 4 669 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I III I I I I I I I 
Db 3216 T GC AGGAAAAC TAC C T GGAGTACC GGC AGG T C C CCGGC AG TGAT C C T GC AT G T TAT GAAT 3275 

Qy 4 670 TCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGA 4 72 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 3276 TCCTGTGGGGTCCAAGGGCCCTCGTTGAAACCAGCTATGTGAAAGTCCTGCACCATATGG 3335 

Qy 4 7 30 T C AAGGT C AG T GC AAGAGT TCGCTTTTTCTTCC CAT C CC T GC GT GAAGC AGC T T T GAGAG 4 78 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3336 T AAAGAT C AG T GGAGGAC C TC AC AT T T C C TAC C C AC C CC T GC AT GAGT GGGT T T T GAGAG 3395 

Qy 4790 AGG AGGAAGAGGGAG T C TGAGC AT GAGT TGC AGC C AAGGC C AGT GGGAGGGGGAC T GGGC 4849 

III I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3396 AGGGGGAAGAGTGAGTCTGAGCAC GAGT TGCAGCCAGGGCCAGTGGGAGGGGGTCT GGGC 3455 

Qy 4850 CAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCA 4 909 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 34 56 CAGTGCACCTTCCGGGGCCGCATCCCTTAGTTTCCACTGCCTCCTGTGACGTGAGGCCCA 3515 

Qy 4910 TTCTTCACTC — TGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGG 4 967 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3516 TTCTTCACTCTTTGAAGCGAGCAGTCAGCATTCTTAGTAGTGGGTTTCTGTTCTGTTGGA 3575 

Qy 4 968 TGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGA 5027 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I III 
Db 3576 TGACTTTGAGATTATTCTTTGTTTCCTGTTGGAGTTGTTCAAATG-TTCCTTTTAACGGA 3634 

Qy 5028 TGG T T GAATGAAC T T C AGC AT CC AAGT T T ATG AATGAC AGC AG T C AC AC — AGTTCTGTG 508 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I III I I I I 
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Db 3635 T GG T T GAATGAGC GT C AGC ATC CAGGT T TATGAATGAC AG TAGT C AC AC AT AGTGC T GT T 3694 

Qy 5086 TAT AT AG T T TAAGGG TAAGAGTCT TGTG TT T T AT TC AGAT TGGGAAAT C CAT TC TAT T T T 514 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I Mill 
Db 3695 TAT AT AG T T TAGGAG TAAGAGT C TTGTTTTTTAC TC AAAT TGGGAAAT C CAT T C CAT T T T 3754 

Qy 514 6 GTGAAT T GGG — ATAATAACAGCAGTGGAATAAGTA C T TAG AAAT G TGA- AAAAT G 5198 

I I I I I I I I I I I I I I II II I I I I M I I I I I I I I I I I I I I I I I III 

Db 3755 GTGAAT T GTGACATAATAATAGCAGTGGTAAAAGTAT TTGCT TAAAAT TGTGAGCGAAT T 3814 

Qy 5199 AGCAGTAAAATAGATGAGATAAAGAACTAAAGAAATTAAGAGATAGTCAATTCTTGCCTT 5258 

I I I I III III I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I II M I I 

Db 3815 AGCAATAACATACATGAGAT AAC T C AAG AAAT C AAAAGAT AG T T GAT TCTTGCCTT 3870 

Qy 5259 ATACCTCAGTCTATTCTGTAAAATTTTTAAAGATATATGCATACCTGGATTTCCTTGGCT 5318 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I III I I I I I I I I I I I II 
Db 3871 GTACCTCAATCTATTCTGTAAAA T TAAACAAAT ATGC AAAC C AGGAT T T C C T T GAC T 3927 

Qy 5319 TCTTTGAGAATGTAAGAGAAATTAAATCTGAATAAAGAATTCTTCCTGTTCACTGGCTCT 5378 

I I I I I I I I I I I I III I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I 
Db 3928 TC T T T GAGAAT GC AAGC GAAAT TAAAT C TGAAT AAAT AAT TCTTCCTCTT C AC T GGC T C G 3987 

Qy 5379 TTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATG 5438 

I I I I I I III I I I II I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I II I I I I 
Db 3988 TTTCTTTTCCGTTCACTCAGCATCTGCTCTGTGGGAGGCCCTGGGTTAGTAGTGGGGATG 4047 

Qy 54 39 C T AAGGT AAGC C AGAC T C AT AC CC ACC C ATAGGGTC GT AGAGTC TAGGAGC T GC AG T C AC 5498 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4048 C T AAGGT AAGC C AGAC T C AC GC C T ACC C ATAGGGC T GT AGAGC C TAGGAC C T GC AG T C AT 4107 

Qy 54 99 GT AAT C G AGGT GGC AAGAT GT C C T C T AAAGATGTAGGGAAAAGT GAGAGAGGGG T GAGGG 5558 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4108 AT AAT TAAGG T GGT G AGAAGT C C T GTAAGATGT AGAGGAAAT GT AAGAGAGGGG T GAGGG 4167 

Qy 5559 TGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 55 95 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III 
Db 4168 TGTGGCGCTCCGGGTGAGAGTAGTGGAGTGTC AGTGC 4204 
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SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 28 
LENGTH: 4204 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-11-323-964-28 

Query Match 31.1%; Score 1762.6; DB 9; Length 4204; 

Best Local Similarity 81.0%; Pred. No. 0; 

Matches 2315; Conservative 0; Mismatches 474; Indels 68; Gaps 20; 

Qy 2790 AGGGACCCCCATCTGGTCTAAAGACAGAGCGGTCCCAGGATCTGCCATGCGTTCGGGTGA 2849 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1365 AGGGGCCCCTATGTGGTGGACAGATGCAGTGGTCCTAGGATCTGCCAAGCATCCAGGTGA 1424 

Qy 2850 GGAACAT GAGGGAGGACTGAGGGTACCC CAGGACCAGAAC AC TGA-GGGAGACTGCACAG 2908 

II I I I I I I I I I I II I I I I I I II I I II I I I I I III II I I III 
Db 1425 AGAGAC T GAGGGAGGATTGAGGGTACCC CTGGGACAGAAT GCGGAC TGGGGGCC CC ATAA 1484 

Qy 2 909 AAATCAGCCCTGCCCCTGCTGTCACCCCAGAGAGCATGGGCTGGGCCGTCTGCCGAGGTC 2 968 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I III II I I I I I I 
Db 1485 AAATCTGCCCTGCTCCTGCTGTTACCTCAGAGAGCCTGGGCAGGGCTGTCAGCTGAGGTC 1544 

Qy 2969 CTTCCGTTATCCTGGGATCATTGATGTCAGGGACGGGGAGGCCTTGGTCTGAGAAGGCTG 3028 

I Ml I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 154 5 CCTCCATTATCCTAGGATCACTGATGTCAGGGAAGGGGAAGCCTTGGTCTGAGGGGGCTG 1604 

Qy 3029 CGCTCAGGTCAGTAGAGGGAGCGTCCCAGGCCCTGCCAGGAGTCAAGGTGAGGACCAAGC 3088 

I I I I I I I I I M I I I I It I I II Ml I I II I II I I I I I I II I I I I I I I I I I I 
Db 1605 C AC TC AGGGCAGTAGAGGGAGGCT C TCAGACC C TAC TAGGAGTGGAGGTGAGGACC AAGC 1664 

Qy 3089 GGGCACCTCACCCAGGACACATTAATTCCAATGAATTTTGATATCTCTTGCTG-CCCTTC 3147 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1665 AGTCTCCTCACCCAGGGTACATGGACTTCAATAAATTTGGACATCTCTCGTTGTCCTTTC 1724 

Qy 3148 CCCAAGGACCTAGGCACGTGTGGCCAGATGTTTGTCCCCTCCTGTCCTTCCATTCCTTAT 3207 

I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I III I I I I I I 
Db 1725 CGGGAGGACCTGGGAATGTATGGCCAGATGTGGGTCCCCTCATGTTTTTCTGTACCATAT 1784 

Qy 3208 CAT GG AT G T G AAC T C T T G — AT T T GGAT T T C T C AGAC C AGC AAAAGGGC AGGAT CC AGGC 3265 

I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1785 C AGGT AT GT GAGT TC T T GAC ATGAGAGAT T C T C AGG C C AGC AGAAGGGAGGGAT - T AGGC 1843 

Qy 32 66 C C T GC C AGGAAAAAT AT AAGGGCC C TGC GT GAGAAC AGAGGGGG T CAT C C AC T GC ATGAG 3325 

Ml I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I II II 
Db 1844 C C T AT AAGGAGAAAGGT GAGGGCC C TGAGT GAGC AC AGAGGGGAT C C T CC AC C C C AG TAG 1903 

Qy 3326 AGT GGGGATGT CACAGAGT CCAGC CCAC CC TC C TGGTAGC AC TGAGAAGCC AGGGC TGTG 3385 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I II I I I 

Db 1904 AGTGGGGACCTCACAGAGTCTGGCCAACCCTCCTGACAGTTCTGGGAATCCGTGGCTGCG 1963 

Qy 338 6 CTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTC CTGGAGCTCCAGGA 34 38 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1964 TTTGCTGTCTGCACATTGGGGGCCCGTGGATTCCTCTCCCAGGAATCAGGAGCTCCAGGA 2023 

Qy 3439 AC C AGGC AGTGAGGC C T T GGT C TGAGAC AGT ATC C T C AGG TC AC AGAGC AGAGGAT GC AC 3498 

II I I I I I I I I I I I I I I I I I II I M I I I I I II I I I II I I I I II II II I I I II I 

Db 2024 AC AAGGC AG TGAGGAC T T GGT C TGAGGC AGT GTC C T C AGG T C AC AGAGT AGAGGGGGC TC 2083 

Qy 34 99 AGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCACAG 3558 

M I I I II I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I III 
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Db 2084 AGATAGTGCCAACGGTGAAGGTTTGCCTTGGATTCAAACCAAGGGCCCCACCTGCCCCAG 2143 

Qy 3559 GACACATAGGACTCCACAGAGTCTGGCCTCA-CCTCCCTACTGTCAGTCCTGTAGAATCG 3617 

I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I 1 I I I I I II II 
Db 2144 AAC AC AT - GGAC TC C AGAGC GC C TGGC C T C AC C C TC AATAC T T T C AGTC C T GC AGC C T C A 2202 

Qy 3618 ACCTCTGCTGGCCGGCTGTACCCTGA-GTACCCTCTCACTTCCTCCTTCAGGTTTTCAGG 367 6 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 2203 GCATGCGCTGGCCGGATGTACCCTGAGGTGCCCTCTCACTTCCTCCTTCAGGTTCTGAGG 2262 

Qy 3677 GGACAGGCC AACCCAGAGGACAGGATTC CC TGGAGGCCAC AGAGGAGC ACCAAGGAGAAG 3736 

I I I I I I I I III I I I I I I II III I I II I I II I I I I I I 

Db 2263 GGACAGGC TGAC C T GGAGGAC C AGAGGC C C CC GGAGGAGC AC T G AAGGAGAAG 2315 

Qy 3737 ATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGG TTCAGTTCTCAGCTGAGGCCT 3791 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2316 AT C TGTAAG T AAGC C T T TG T T AGAGCC T C C AAGGT T C CAT TC AG T ACT C AGC TGAGGT C T 2375 

Qy 3792 CTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACAC 3851 

I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 2376 CTCACATGCTCCCTCTCTCCCCAGGCCAGTGGGTCTCCATTGCCCAGCTCCTGCCCACAC 2435 

Qy 3852 TCCTGCCTGCTGCCCT GAC GAGAG T CAT C ATG T C TC T T GAGC AGAGGAGTC TGC AC T GC A 3911 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2436 TCCCGCCTGTTGCCCT GAC C AGAG T CAT C ATGC C T C T T GAGC AGAGGAGT C AGC AC T GC A 2495 

Qy 3912 AGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCT- 3970 

I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I 
Db 2496 AGCCTGAAGAAGGCCTTGAGGCCCGAGGAGAGGCCCTGGGCCTGGTGGGTGCGCAGGCTC 2555 

Qy 3971 GCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGG 4010 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2 556 CTGCTACTGAGGAGCAGGAGGCTGCCTCCTCCTCTTCTACTCTAGTTGAAGTCACCCTGG 2 615 

Qy 4011 AGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCT 4070 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 616 GGGAGGTGCCTGCTGCCGAGTCACCAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCAGCC 2 67 5 

Qy 4071 T T C C C AC T AC CATC AAC T T C AC TC GAC AGAGGC AAC C C AG T GAGGGT T C C AGC AGC C GTG 4130 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 67 6 TC C C C AC TACC ATGAAC TAC C C TC TC TGGAGC C AAT C C TAT GAGGAC T CC AGC AAC C AAG 2735 

Qy 4131 AAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTA 4190 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2736 AAG AGGAGGGGC C AAGC AC C T T C C C TGAC C TGGAG T C C GAGT T C C AAGC AGC AC T C AGT A 27 95 

Qy 4191 AGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCA 4250 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2796 GGAAGGTGGCCGAGTTGGTTCATTTTCTGCTCCTCAAGTATCGAGCCAGGGAGCCGGTCA 2855 

Qy 4251 CAAAGGCAGAAATGCTGGAGAGTGTCATCAAAAATTACAAGCACTGTTTTCCTGAGATCT 4310 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I 

Db 2856 CAAAGGCAGAAATGCTGGGGAGTGTCGTCGGAAATTGGCAGTATTTCTTTCCTGTGATCT 2915 

Qy 4 311 TCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACC 4 370 

II I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I II Ml | | | | | | | | | 

Db 2916 TCAGCAAAGCTTCCAGTTCCTTGCAGCTGGTCTTTGGCATCGAGCTGATGGAAGTGGACC 2975 

Qy 4371 CCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGG 4430 

Ml I I I I I I I I II II III I I I I I I I I I II I I I I I I I I I I I II I I I I I IE I 
Db 2976 CCATCGGCCACTTGTACATCTTTGCCACCTGCCTGGGCCTCTCCTACGATGGCCTGCTGG 3035 
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Qy 4431 GTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAA 4490 

I I I I I I I I II I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I III II I I I I 
Db 3036 GTGACAATCAGATCATGCCCAAGGCAGGCCTCCTGATAATCGTCCTGGCCATAATCGCAA 3095 

Qy 4491 TGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGT 4 550 

I I I I I I I I III I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I II I 
Db 3096 GAGAGGGCGACTGTGCCCCTGAGGAGAAAATCTGGGAGGAGCTGAGTGTGTTAGAGGTGT 3155 

Qy 4551 ATGAT GGGAGGGAGC AC AG T GCC TAT GGGGAGC C C AGGAAGC T GC TC AC CC AAGAT T TGG 4 610 

III I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3156 T TGAGGGGAGGGAAGACAGTATC T TGGGGGATCCCAAGAAGC TGC TCACCCAACAT T TC G 3215 

Qy 4 611 TGC AGGAAAAG T AC C T GGAG T A- C GGC AGGT GC C GGAC AG T GAT C C C GC AC GC TAT GAGT 4 669 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I 
Db 3216 TGC AGGAAAAC T ACC TGGAGT AC C GGC AGGT C C C C GGC AG T GAT C C T GC AT G T TAT GAAT 3275 

Qy 4 670 TCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGA 4729 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 3276 TCCTGTGGGGTCCAAGGGCCCTCGTTGAAACCAGCTATGTGAAAGTCCTGCACCATATGG 3335 

Qy 4730 T C AAGGT C AGT GCAAGAGT T C GC T T T T T C T TCC C AT C C C T GC GT GAAG CAGC T T TGAGAG 4789 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3336 T AAAGAT C AG T GGAG GAC C T C AC AT T T C C T AC C C AC C C C T GC AT GAGT GGG T T T T G AGAG 3395 

Qy 47 90 AGGAGGAAGAGGGAG TC TGAGCAT GAGT TGCAGCCAAGGC CAGT GGGAGGGGGACT GGGC 4 849 

III I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3396 AGGGGGAAGAG T GAG T C TG AGC AC GAGT TGC AGC C AGGGC CAGT GGGAGGGGGT C T GGGC 3455 

Qy 4850 CAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCA 4909 

I I I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3456 CAGTGCACCTTCCGGGGCCGCATCCCTTAGTTTCCACTGCCTCCTGTGACGTGAGGCCCA 3515 

Qy 4 910 TTCTTCACTC — TGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGG 4 967 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3516 TTCTTCACTCTTTGAAGCGAGCAGTCAGCATTCTTAGTAGTGGGTTTCTGTTCTGTTGGA 3575 

Qy 4 968 TGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGA 5027 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I III 
Db 3576 TGACTTTGAGATTATTCTTTGTTTCCTGTTGGAGTTGTTCAAATG-TTCCTTTTAACGGA 3634 

Qy 5028 TGGTTGAATGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTCACAC— AGTTCTGTG 5085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I 
Db 3635 TGGTTGAATGAGCGTCAGCATCCAGGTTTATGAATGACAGTAGTCACACATAGTGCTGTT 3694 

Qy 5086 TATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGAAATCCATTCTATTTT 5145 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 
Db 3695 TAT AT AGT T T AGGAGT AAGAGTCT TGT T T T TT AC TC AAAT TGGG AAAT CC AT TCC AT T T T 3754 

Qy 514 6 GT GAAT TGGG — ATAATAACAGCAGTGGAATAAGTA CTTAGAAATGTGA- AAAAT G 5198 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 3755 GTGAATTGTGACATAATAATAGCAGTGGTAAAAGTATTTGCTTAAAATTGTGAGCGAATT 3814 

Qy 5199 AGC AGT AAAAT AGAT GAGAT AAAGAAC T AAAGAAAT T AAGAGAT AGTC AAT TC T TGC C T T 5258 

I I I I III III I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I 

Db 3815 AGCAATAACATACATGAGAT AAC T C AAGAAAT C AAAAGAT AGT TG AT TC T TGC C T T 3870 

Qy 5259 AT ACC TC AGTC TAT T C TGT AAAAT TT T T AAAGATAT ATGC ATAC C TGGATT TCC T T GGC T 5318 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II 
Db 3871 GTACCTCAATCTATTCTGTAAAA T TAAAC AAAT ATGC AAAC C AGGAT T TC C T T GAC T 3927 
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1 1 


Qy 5319 T C T T TGAGAAT GT AAGAGAAAT T AAATC TGAATAAAGAAT TCTTCCTGTT C AC T GGC TC T 5378 

1 I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I 
Db 3928 TC T T TGAGAAT GC AAGCGAAAT TAAATC TGAATAAATAAT TC T T CC TC TTC AC TGGC TCG 3987 

Qy 5379 TTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATG 5438 

I I I I I I III I I I I I I I I I I I I I I I I IN I I I I I I I I I II I I I I I I I I I I I I I 
Db 3988 TTTCTTTTCCGTTCACTCAGCATCTGCTCTGTGGGAGGCCCTGGGTTAGTAGTGGGGATG 4047 

Qy 54 39 C TAAGGT AAGC C AGAC TCATACCC ACCCATAGGGTC GTAGAGTC TAGGAGCT GCAGTC AC 54 98 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I 1 I I 1 I I I I 
Db 4048 C TAAGGT AAGC C AGAC T C AC GC C T ACC C ATAGGGC T GT AG AGC C TAGGAC C T GC AG T CAT 4107 

Qy 54 99 GTAATC GAGGT GGC AAGAT GT C C T C T AAAGAT GTAGGGAAAAGT GAGAGAGGGGTGAGGG 5558 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4108 ATAAT TAAGGT GGTGAGAAGTC C T GTAAGATG TAGAGGAAAT G T AAGAGAGGGGTGAGGG 4167 

Qy 5559 TGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGC 5595 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I III 
Db 4168 TGTGGCGCTCCGGGTGAGAGTAGTGGAGTGTCAGTGC 4204 


RESULT 8 

US-11-253-240-13 

; Sequence 13, Application US/11253240 
; Publication No.. US20060127356A1 
GENERAL INFORMATION: 

APPLICANT: Gaugler, Batrice; Van den Eynde, BenoEt; 

van der Bruggen, Pierre; Boon-Falleur , Thierry 
TITLE OF INVENTION: Isolated Nucleic Acid Molecules Coding For 
; Tumor Rejection Antigen Precursor Mage-3 And Uses Thereof 

NUMBER OF SEQUENCES: 30 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 

STREET: 805 Third Avenue 

CITY: New York City 

STATE: New York 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM 

OPERATING SYSTEM: PC-DOS 

SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/11/253,240 

FILING DATE: 17-Oct-2005 

CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/09/57 9,543 

FILING DATE: 26-May-2000 

APPLICATION NUMBER: 09/583,850 

FILING DATE: 

APPLICATION NUMBER: PCT/US92 /04354 
FILING DATE: 22-MAY-1992 
APPLICATION NUMBER: 07/807,043 
FILING DATE: 12-DECEMBER-1991 
APPLICATION NUMBER: 07/764,365 
FILING DATE: 2 3-SEPTEMBER-1991 
APPLICATION NUMBER: 07/728,838 
FILING DATE: 9-JULY-1991 
APPLICATION NUMBER: 07/705,702 
FILING DATE: 23-MAY-1991 
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ATTORNEY /AGENT INFORMATION: 
NAME: Hanson, Norman D. 
REGISTRATION NUMBER: 30,946 
REFERENCE/DOCKET NUMBER: LUD 5353 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (212) 688-9200 
TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 13: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 2531 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
MOLECULE TYPE: genomic DNA 
FEATURE : 

NAME/KEY: MAGE- 4 gene 
SEQUENCE DESCRIPTION: SEQ ID NO: 13: 
US-11-253-240-13 

Query Match 29.6%; Score 1678.8; DB 8; Length 2531; 

Best Local Similarity 84.4%; Pred. No. 0; 

Matches 207 4; Conservative 0; Mismatches 317; Indels 65; Gaps 14; 

Qy 3256 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I I I I I I I II I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGATCCAGGCCCTGCCTGGAGAAATGTGAGGGCCCTGAGTGAACACAGTGGGGATCATCC 60 

Qy 3316 AC T GC AT GAGAGT GGGGAT GTC AC AGAG T C C AGC C C AC C C TC C T GG T AGC AC TGAGAAGC 337 5 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 61 AC T C CAT GAGAGTGGGGAC C TCAC AGAGTCCAGCC TACCC TC TTGATGGCAC TGAGGGAC 120 

Qy 337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CGGGGCTGTGCTTACAGTCTGCACCCTAAGGGCCCATGGATTCCTCTCCTAGGAGCTCCA 180 

Qy 34 36 GGAACC AGGCAGTGAGGCC T TGGTC TGAGACAGTATCC TC AGGT CACAGAGC AGAGGATG 34 95 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAAC AAGGC AGT GAGGC C T TGGT C T GAGAC AGT GT C C T C AGGT TAC AGAGC AGAG GAT G 240 

Qy 34 96 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 41 CACAGGCTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AGGAC AC ATAGGAC T C C AC AGAG TC T G GC C T C AC C T C C C TAC T GT CAGTC C T G TAGAAT 3615 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 

Db 301 C AAG AC AC AT AGGAC T C C AAAGAG T C T GGC C T C AC C T C C C TAC CAT C AAT C C T GC AGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGA-GTACCCTCTCACTTCCTCCTTCAGGTTTTCA 3 674 

I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTATACCCTGAGGTGCTCTCTCACTTCCTCCTTCAGGTTCTGA 420 

Qy 3675 GGGGACAGGCCAACCCAGAGGACAGGATTCCCTGGAGGCCACAGAGGAGCACCAAGGAGA 3734 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCAGACAGGCC AACC - - GGAGACAGGATTC C C TGGAGGCC AC AGAGGAGC ACCAAGGAGA 478 

Qy 37 35 AGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTC 37 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I III III II I I I I I I I I I I I I I I I I I I I 
Db 4 79 AGATCTGTAAGTAAGCCTTTGTTAGAGCCTCTAAGATTTGGTTCTCAGCTGAGGTCTCTC 538 

Qy 3795 ACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCC 3854 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 539 ACATGCTCCCTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCCAGCTTTTGCCTGCACTCT 598 

Qy 3855 TGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGC 3914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 599 TGCCTGCTGCCCTGACCAGAGTCATCATGTCTTCTGAGCAGAAGAGTCAGCACTGCAAGC 658 

Qy 3915 CTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCA 3974 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I 
Db 659 CTGAGGAAGGCGTTGAGGCCCAAGAAGAGGCCCTGGGCCTGGTGGGTGCACAGGCTCCTA 718 

Qy 3975 C CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGG 4010 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 719 CTACTGAGGAGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTCTGGTCCCTGGCACCCTGG 778 

Qy 4011 AGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCT 4070 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 779 AGGAAGT GC C T GC T GC T GAGT C AG C AGG T C C T C CCC AGAG TC C T C AGGGAGC C T C T GC C T 838 

Qy 4071 T T C CC AC TAC C ATC AAC T T C AC TC GAC AGAGGC AAC C C AG TGAGGGT T C C AGC AGC C GT G 4130 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 839 T AC CC AC TAC CAT C AGC T T C AC T T GC T GGAGGC AAC C C AATGAGGGT T C C AGC AGC C AAG 898 

Qy 4131 AAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTA 4190 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8 99 AAGAGGAGGGGCCAAGCACCTCGCCTGACGCAGAGTCCTTGTTCCGAGAAGCACTCAGTA 958 

Qy 4191 AGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCA 4250 

I I I I I I I I III I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 
Db 959 ACAAGGTGGATGAGTTGGCTCATTTTCTGCTCCGCAAGTATCGAGCCAAGGAGCTGGTCA 1018 

Qy 4251 C AAAGGC AGAAAT GC TGGAGAGTG TC AT C AAAAAT T AC AAGC AC TGTTTTCCT GAG ATC T 4310 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I 
Db 1019 C AAAGGC AGAAAT GC TGGAGAGAG T CAT C AAAAAT TAC AAGC GC TGC T T TC C T GTG ATC T 1078 

Qy 4311 TCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACGTGAAGGAAGCAGACC 4370 

I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 107 9 TC GGC AAAGC C T C C GAGT C C C T GAAGAT GAT C T T T GGC AT TGAC GTGAAGGAAGT G GAC C 1138 

Qy 4371 CCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGG 4430 

II II II II I I I I I II I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I 

Db 1139 CCGCCAGCAACACCTACACCCTTGTCACCTGCCTGGGCCTTTCCTATGATGGCCTGCTGG 1198 

Qy 4431 GTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAA 4490 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I 
Db 1199 GTAATAATCAGATCTTTCCCAAGACAGGCCTTCTGATAATCGTCCTGGGCACAATTGCAA 12 58 

Qy 4491 TGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGT 4550 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1259 TGGAGGGCGACAGCGCCTCTGAGGAGGAAATCTGGGAGGAGCTGGGTGTGATGGGGGTGT 1318 

Qy 4551 ATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGG 4610 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IE 
Db 1319 ATGATGGGAGGGAGCACACTGTCTATGGGGAGCCCAGGAAACTGCTCACCCAAGATTGGG 1378 

Qy 4 611 TGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATCCCGCACGC TAT GAGT 4 669 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I 
Db 1379 TGCAGGAAAACTACCTGGAGTACCGGCAGGTACCCGGCAGTAATCCTGCGCGCTATGAGT 14 38 

Qy 4670 TCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGA 4729 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 
Db 14 39 TCCTGTGGGGTCCAAGGGCTCTGGCTGAAACCAGCTATGTGAAAGTCCTGGAGCATGTGG 14 98 
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Qy 4730 T C AAGG T C AGT GC AAGAGT TCGCTTTTTCTTCC CAT C C C T GC GT GAAG CAGC T T TGAGAG 4 789 

III I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I II I I I I II I I I I II 
Db 1499 T C AGGGT C AAT GC AAGAGT TC GC AT T GC C TAC C CAT C C C T GC GT GAAGC AGC T T TG TT AG 1558 

Qy 4790 AGGAGGAAGAGGGAG T C TGAGC AT GAGT TGC AGC C AAGGC C AGT GGGAGGG GGACT 4845 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I III I I I I II II II 

Db 1559 AGGAGGAAGAGGGAG T C T GAGC AT GAGT TGC AGC C AGGGC T GTGGGGAAGGG GC AGGGC T 1618 

Qy 484 6 GGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGG 4 905 

I I I I I I I I I I I II II III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1619 GGGCCAGTGCATCTAACA — GCCCTGTGCAGCAGCTTCCCTTGCCTCGTGTAACATGAGG 1676 

Qy 4 906 CCCATTCTTCACTC TGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCT 4 961 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1677 CCCATTCTTCACTCTGTTTGAAGAAAATAGTCAGTGTTCTTAGTAGTGGGTTTCTATTTT 1736 

Qy 4962 ATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTT 5021 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1737 GTTGGATGACTTGGAGATTTATCTCTGTTTCCTTTTACAATTGTTGAAATG-TTCCTTTT 1795 

Qy 5022 AAG GGAT GGT T GAAT GAAC TTC AG CAT C C AAGT T T ATGAAT GAC AGC AGT C AC AC AGT T C 5081 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1796 AAT GGATGGTT GAAT TAACTTCAGCATCCAAGTTTATGAATCGT AGT TAACGTATATTGC 1855 

Qy 5082 TG T GT AT AT AG T T T AAGGG T AAGAGTC T TGTG T T TT AT T C AGAT T GGGAAAT C CAT T C TA 5141 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1856 TGT T AAT AT AG T T T AGGAG T AAGAGTC T TGT T T T TT AT T C AGAT T GGGAAAT C C GT T C TA 1915 

Qy 5142 TTTTGTGAATTGGG AT AAT AAC AGC AG T GGAAT AAG TAC T T AG AAAT G TG AAAAAT G 5198 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MM III 

Db 1916 TTTTGTGAATTTGGGACATAATAACAGCAGTGGAGTAAGTATTTAGAAGTGTG AATT 1972 

Qy 5199 AGC AG T AAAAT AGAT GAGATAAAGAAC T AAAGAAAT T AAG AGAT AGTC AAT TCTTGCCTT 5258 

I I I I II M I I I I I II I I I II I I I M I I I I II I I I I I I I 

Db 1973 CACCGTGAAATAGGTGAGAT AAATTAAAAGATACTTAATTCCCGCCTT 2020 

Qy 5259 ATACC TC AGTC TAT T C TGT AAAAT T TT TAAAGATAT ATGC ATAC C TGGAT T T CC TT GGC T 5318 

II II I II I II I II II I I I I II II I I III II I I II I I I I I M I I II I II I II I I II I 

Db 2021 ATGCCTCAGTC TAT TCTGTAAAATTTAAAAATATATATGCATACC TGGAT TTCCTT GGC T 2080 

Qy 5319 T C T T T GAGAAT GTAAGAGAAAT T AAATC TGAAT AAAGAAT TCTTCCTGTT C AC T GGC TC T 5378 

II I I I I I II II I I II I II I I I I II II M I I I I I IE II I I I I II I I I II I II I 
Db 2081 TC GTGAATGTAAGAGAAATTAAATCTGAATAAATAATTCTTTCTGTTAACTGGCTCA 2137 

Qy 537 9 TTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATG 5438 

I I II I I I I I I II II II I II II I I I I I I I I II II II I I I II I I I II II I II I I II 

Db 2138 TTTCTTCTCTATGCACTGAGCATCTGCTCTGTGGAAGGCCCAGGATTAGTAGTGGAGATA 2197 

Qy 5439 C TAAGGT AAGC C AGAC TC ATACCC ACCC ATAGGGTC GTAGAGTC TAGGAGC T GCAGTCAC 5498 

II I II I I II I II I I I II II I I I I I II I II I II I II II I I 

Db 2198 C TAGGGT AAGC C AGAC AC AC AC CTACC GAT AGGGT AT T AAGAGT C TAGGAGC GCGGTCAT 2257 

Qy 5499 GTAATCGAGGT GGC AAGATGTCCT C TAAAGATGTAGGGAAAAGT GAGAGAGGGGTGAGGG 5558 

II II I I I I I I I I II II I I I I I II I I II II II II I I II I I I I 

Db 2258 AT AAT TAAGGT GAC AAGAT GTC C T C TAAGATGT AGGGGAAAAGT AACGAGTGTGGG 2313 

Qy 5559 TGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCT 5618 

I II I II I I II II I II I II II II I I I II III I II I I I I II I II I I II I I II I 
Db 2314 TATGGGGCTCCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGTG-TGGGGCCTTTTGGGCT 2372 
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Qy 5619 TTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I III 
Db 2373 TTGGGAAACTGCATTTTCTTCTGAGGGATCTGATTCTAATGAAGCTTGGTGGGTCC 2428 


RESULT 9 

US-11-253-240-14 

; Sequence 14, Application US/11253240 
; Publication No. US20060127356A1 
GENERAL INFORMATION: 

APPLICANT: Gaugler, Batrice; Van den Eynde, BenoEt; 
; van der Bruggen, Pierre; Boon-Falleur , Thierry 

TITLE OF INVENTION: Isolated Nucleic Acid Molecules Coding For 
; Tumor Rejection Antigen Precursor Mage-3 And Uses Thereof 

NUMBER OF SEQUENCES: 30 
CORRESPONDENCE ADDRESS: 

ADDRESSEE : Felfe & Lynch 

STREET: 805 Third Avenue 

CITY: New York City 

STATE: New York 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM 

OPERATING SYSTEM: PC-DOS 

SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/11/253,24 0 

FILING DATE: 17-Oct-2005 

CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/09/579,54 3 

FILING DATE: 2 6-May-2000 

APPLICATION NUMBER: 09/583,850 

FILING DATE: 

APPLICATION NUMBER: PCT/US92 /04354 

FILING DATE: 22-MAY-1992 

APPLICATION NUMBER: 07/807,043 

FILING DATE: 12-DECEMBER-1991 

APPLICATION NUMBER: 07/764,365 

FILING DATE: 2 3 - SE PTEMBER- 1991 

APPLICATION NUMBER: 07/728,838 

FILING DATE: 9-JULY-1991 

APPLICATION NUMBER: 07/705,702 

FILING DATE: 23-MAY-1991 
ATTORNEY /AGENT INFORMATION: 
; NAME: Hanson, Norman D. 

REGISTRATION NUMBER: 30,946 

REFERENCE/DOCKET NUMBER: LUD 5353 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 14: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 2531 base pairs 

TYPE: nucleic acid 

STRANDEDNESS : single 

TOPOLOGY: linear 
MOLECULE TYPE: genomic DNA 
FEATURE : 

NAME/KEY: MAGE- 41 gene 
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SEQUENCE DESCRIPTION: SEQ ID NO: 14: 
US-11-253-240-14 

Query Match 29.6%; Score 1678.8; DB 8; Length 2531; 

Best Local Similarity 84.4%; Pred. No. 0; 

Matches 2074; Conservative 0; Mismatches 317; Indels 65; Gaps 14; 

Qy 3256 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I I I I I I I I I I I I II I III I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGATCCAGGCCCTGCCTGGAGAAATGTGAGGGCCCTGAGTGAACACAGTGGGGATCATCC 60 

Qy 3316 AC T GC ATGAGAGTGGGGAT GTC AC AGAG TCC AGC C C AC C C T C C T GGT AGC AC T GAG AAGC 3375 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 61 AC T C C ATGAGAGTGGGGAC C TC AC AGAG TC C AGC C T AC C C T C T T GAT GGC AC T GAGGGAC 120 

Qy 337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 34 35 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I MINIMI 
Db 121 CGGGGCTGTGC TTACAGTC TGCACCCTAAGGGCCCATGGATTCC TC TCCTAGGAGC TCC A 180 

Qy 3436 GGAACCAGGCAGTGAGGCC TTGGTC TGAGACAGTATCCTCAGGTCACAGAGCAGAGGATG 3495 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAACAAGGCAGTGAGGCC T TGGT C TGAGACAGTGTCC TC AGGT TACAGAGC AGAGGATG 240 

Qy 34 96 CACAGGGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 3555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 41 CACAGGCTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCTGCCA 300 

Qy 3556 C AG GAC AC ATAGGAC TC C ACAGAG T C T G GC C T C AC C TC C C T AC T GT C AGT C C T G T AGAAT 3615 

II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I III I I I I I I I I I I 

Db 301 CAAGAC AC ATAGGAC TC CAAAGAG TCTGGCCT C AC C TC C C T AC CAT C AAT C C T GC AGAAT 360 

Qy 3616 CGACCTCTGCTGGCCGGCTGTACCCTGA-GTACCCTCTCACTTCCTCCTTCAGGTTTTCA 3674 

I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 
Db 361 CGACCTCTGCTGGCCGGCTATACCCTGAGGTGCTCTCTCACTTCCTCCTTCAGGTTCTGA 420 

Qy 3675 GGGGAC AGGC C AAC C C AGAGGAC AGGAT T C C C T GGAGGC C AC AG AGGAGC AC C AAG GAGA 3734 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCAGACAGGCCAACC — GGAGAC AGGAT TC C C TGGAGGC C AC AGAG GAGC AC C AAGGAG A 47 8 

Qy 3735 AGATCTGTAAGTAGGCCTTTGTTAGAGTCTCCAAGGTTCAGTTCTCAGCTGAGGCCTCTC 3794 

I I I I I I I I I I I I I I I I I I I I I I I I I I III III II I I II I I I I I I I I I I I I I I I 
Db 479 AGAT C T GT AAG TAAGC C T T T GT T AGAGC C T C T AAGAT T T G GT TC TC AGC TGAGGTC T C TC 538 

Qy 3795 ACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCC 3854 

III I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 539 ACATGCTCCCTCTCTCCGTAGGCCTGTGGGTCCCCATTGCCCAGCTTTTGCCTGCACTCT 598 

Qy 3855 TGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGAGGAGTCTGCACTGCAAGC 3914 

I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 599 TGCCTGCTGCCCTGAGCAGAGTCATCATGTCTTCTGAGCAGAAGAGTCAGCACTGCAAGC 658 

Qy 3915 CTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCA 3974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I III I I I I I I I I I 
Db 659 CTGAGGAAGGCGTTGAGGCCC AAG AAGAGGCCCTGGGCCTGGTGGGTGCGC AGGC TCCTA 718 

Qy 3975 C CTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGG 4010 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 719 CTACTGAGGAGCAGGAGGCTGCTGTCTCCTCCTCCTCTCCTCTGGTCCCTGGCACCCTGG 778 

Qy 4011 AGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCT 4070 

I I I I I I I I I I II I I I MM III I I I I I I I I II II II I II I M II I I I I I MM 
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Db 779 AGGAAGTGCCTGCTGCTGAGTCAGCAGGTCCTCCCCAGAGTCCTCAGGGAGCCTCTGCCT 838 

Qy 4071 T TC C C AC TAC C ATC AAC T T C AC TC GAC AGAGGC AAC C C AG TGAGGG T T CC AGC AGC C GTG 4130 

I I I I 1 I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 839 TAC C C AC TAC CATC AGC T T C AC TT GC TGGAGGCAAC C C AATGAGGGT T CC AGCAGC C AAG 898 

Qy 4131 AAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTA 4190 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 899 AAG AGGAGGGGC C AAGC AC C T C GC C TGAC GC AGAGT CCTTGTTCC GAGAAGC AC T C AGTA 958 

Qy 4191 AGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCA 4250 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 959 ACAAGGTGGATGAGTTGGCTCATTTTCTGCTCCGCAAGTATCGAGCCAAGGAGCTGGTCA 1018 

Qy 4251 C AAAGGC AGAAATGC TGGAGAGTG T CAT C AAAAAT T AC AAGC AC T GT T T T C C TGAGATC T 4310 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I III I I I I I I I I I I I I 
Db 1019 C AAAGGC AGAAATGC TGGAGAGAG T CAT C AAAAAT TAC AAGC GC T GC T T T C C T GT GATC T 1078 

Qy 4311 T C G GC AAAGC C T C TGAGT C C T T GC AGC T GGT C T T T GGC AT T GAC GT GAAGGAAGC AGAC C 4370 

I I I I I I I I I I I I I I I I I II II II IE I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1079 T C G GC AAAGC C T C C GAGT C CC T GAAGAT GAT C T T TG GC AT T GAC GT GAAGGAAGT GGAC C 1138 

Qy 4371 CCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGG 4430 

I I I I I II II I II I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 

Db 1139 CCACCAGCAACACCTACACCCTTGTCACCTGCCTGGGCCTTTCCTATGATGGCCTGCTGG 1198 

Qy 4431 GTGAT AAT C AG AT CAT GC C C AAGAC AGGC T T C C T GATAAT TGTC C T GG TC ATGAT T GC AA 44 90 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1199 GTAAT AATC AGAT C T T T C C C AAGAC AGGC C T T C T GATAAT C GTC C T GGGC AC AAT T GCAA 1258 

Qy 4491 TGGAGGGCGGCCATGCTCCTGAGGAGGAAATCTGGGAGGAGCTGAGTGTGATGGAGGTGT 4550 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1259 TGGAGGGCGACAGCGCCTCTGAGGAGGAAATCTGGGAGGAGCTGGGTGTGATGGGGGTGT 1318 

Qy 4551 AT GAT GG GAGGGAGC AC AG TGC C TAT GGGGAGC C C AGGAAGC TGC T C ACC C AAGAT T TGG 4610 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1319 ATGATGGGAGGGAGCACACTGTCTATGGGGAGCCCAGGAAACTGCTCACCCAAGATTGGG 1378 

Qy 4611 T GC AGGAAAAG TAC C T GGAGT A- C GGC AGGTGC C GGAC AG T GAT C C C GC AC GC TAT GAGT 4669 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I 
Db 1379 TGCAGGAAAACTACCTGGAGTACCGGCAGGTACCCGGCAGTAATCCTGCGCGCTATGAGT 1438 

Qy 4 670 TCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGA 4 72 9 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 
Db 1439 TCCTGTGGGGTCCAAGGGCTCTGGCTGAAACCAGCTATGTGAAAGTCCTGGAGCATGTGG 1498 

Qy 4730 TCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGAAGCAGCTTTGAGAG 4789 

III I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1499 TCAGGGTCAATGCAAGAGTTCGCATTGCCTACCCATCCCTGCGTGAAGCAGCTTTGTTAG 1558 

Qy 4790 AGGAGGAAGAGGGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGG GGACT 484 5 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I III I I I I II II II 

Db 1559 AGGAGGAAGAGGGAGTCTGAGCATGAGTTGCAGCCAGGGCTGTGGGGAAGGGGCAGGGCT 1618 

Qy 4846 GGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGTGTGACATGAGG 4905 

I I I I I I I I I I I II II III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1619 GGGCCAGTGCATCTAACA — GCCCTGTGCAGCAGCTTCCCTTGCCTCGTGTAACATGAGG 167 6 

Qy 4906 CCCATTCTTCACTC TGAAGAGAGCGGTCAGTGTTCTCAGTAGTAGGTTTCTGTTCT 4961 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I 

Db 1677 CCCATTCTTCACTCTGTTTGAAGAAAATAGTCAGTGTTCTTAGTAGTGGGTTTCTATTTT 1736 
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Qy 4 962 ATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTT 5021 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1737 GTTGGATGACTTGGAGATTTATCTCTGTTTCCTTTTACAATTGTTGAAATG-TTCCTTTT 17 95 

Qy 5022 AAGGGATGGTT GAATGAAC T TCAGCATC CAAGT TTATGAATGAC AGCAGTC AC ACAGTTC 5081 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1796 AATGGATGGTTGAATTAACT TCAGCATC CAAGTTTATGAATCGTAGTTAACGTATATTGC 1855 

Qy 5082 T GT GT AT AT AG T T T AAGGG TAAGAGTC TTGTGTTT TAT T C AGAT TGGGAAATC CAT T C T A 5141 

III I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 
Db 1856 T GT T AAT AT AG T T TAGGAG TAAGAGTC T TG T T T T T TAT T C AGAT TGGGAAATC CGT T C TA 1915 

Qy 5142 T T T TGTGAAT T GGG ATAATAACAGC AG TGGAATAAGTAC T TAGAAAT GTGAAAAAT G 5198 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III 

Db 1916 TTTTGTGAATTTGGGACATAATAACAGCAGTGGAGTAAGTATTTAGAAGTGTG AATT 1972 

Qy 5199 AGC AGTAAAAT AGAT GAGAT AAAGAAC T AAAGAAAT T AAG AGAT AGTC AAT TCTTGCCTT 5258 

I I I I I I I I I I I I I I I I I I I I E I I I I I I I I II I I I I I I I 

Db 1973 CACCGTGAAATAGGTGAGAT AAAT T AAAAGAT AC T T AAT TC C C GC C T T 2020 

Qy 5259 AT AC C TC AG T C TAT T C T GT AAAAT T T T T AAAGAT AT AT GC ATAC C T GG AT T T C C T T GGC T 5318 

II I I I I I I I I I I I I I I I I I I I I I I I III I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 2021 ATGCCTCAGTCTATTCTGTAAAATTTAAAAATATATATGCATACCTGGATTTCCTTGGCT 2080 

Qy 5319 T C T T T GAGAAT GT AAGAGAAAT T AAAT C TGAAT AAAGAAT T C T T C C TG T TC AC T GG C T C T 5378 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I EMM I I El I II I 
Db 2081 TC GT GAAT GT AAGAGAAAT T AAAT C TGAAT AAAT AAT TCTTTCTGT TAAC T GGC T C A 2137 

Qy 5379 TTTCTTCTC CAT GC AC T GAGC ATC TGC T TT T T GGAAGGC C C TGGGT T AGTAGTGGAGAT G 5438 

I II I I II I I I II I I II I I I I I I I II I I I I I I I I II I I I II IE E II I I I I I I II E 
Db 2138 TTTCTTCTC TAT GC AC T GAGC ATC T GC T C T GT GGAAGGC C C AGGAT TAGTAGT GGAGAT A 2197 

Qy 54 39 CTAAGGTAAGCCAGACTCATACCCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCAC 5498 

I I I I II I I I I I I I I I I I I I I I El I I I I I II II I I I I I I I 

Db 2198 CTAGGGTAAGCCAGACACACACCTACCGATAGGGTATTAAGAGTCTAGGAGCGCGGTCAT 2257 

Qy 5499 GTAAT C GAGGT GGC AAGAT G TC C T C TAAAGAT GT AGGGAAAAGT GAGAGAGGGGT GAGGG 5558 

I I I I I II I I I I II I I I I I I I I I I I I I I I II I I I I I II I M I 

Db 2258 AT AAT TAAGGT GAC AAGAT G TC C T C TAAGATG T AGGGGAAAAGT AACGAGTGT GGG 2313 

Qy 5559 TGTGGGGCTCCGGGTGAGAGTGGTGGAGTGTCAATGCCCTGAGCTGGGGCATTTTGGGCT 5618 

I I I I I I II I I I I II I I I I I I I I I I I I I III I I I I I I IE I I I I I II I I I I I I 
Db 2314 TATGGGGCTCCAGGTGAGAGTGGTCGGGTGTAAATTCCCTGTG-TGGGGCCTTTTGGGCT 2372 

Qy 5619 TTGGGAAACTGCAGTTCCTTCTGGGGGAGCTGATTGTAATGATCTTGGGTGGATCC 5674 

I I I I El I I I I II II I I I I I I MM MIME I I II I I I I I I II III 
Db 2373 TTGGGAAACTCCATTTTCTTCTGAGGGATCTGATTCTAATGAAGCTTGGTGGGTCC 2428 
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Qy 3256 GGATCCAGGCCCTGCCAGGAAAAATATAAGGGCCCTGCGTGAGAACAGAGGGGGTCATCC 3315 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I III I 

Db 1 GGAT C C AGGC C T TGC C AGGAGAAAGG T GAGGGC C C T G TG T GAGC AC AGAGGG GACC AT TC 60 

Qy 3316 AC T GC AT GAGAGT GGGGAT GT C AC AGAG TC C AGC C C AC C C TC C T GGT AGC AC TGAG AAGC 3375 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 61 ACCCCAAGAGGGTGGAGACCTCACAGATTCCAGCCTACCCTCCTGTTAGCACTGGGGGCC 120 

Qy 337 6 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 f II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 121 TGAGGCTGTGCTTGCAGTCTGCACCCTGAGGGCCCATGCATTCCTCTTCCAGGAGCTCCA 180 

Qy 3436 GGAACCAGGCAGTGAGGCC T TGGTC TGAGACAGTATCC TC AGGTCACAGAGC AGAGGATG 34 95 

I I I I III II I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GGAAACAGACAC TGAGGCC T TGGTC TGAGGCCGTGCCCTCAGGT CACAGAGC AGAGGAGA 240 

Qy 3496 CACAG GGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCT 3551 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II MINI 

Db 241 TGCAGACGTCTAGTGCCAGCAGTGAACGTTTGCCTTGAATGCACACTAATGGCCCCCATC 300 

Qy 3552 GC C AC AGGAC AC ATAGGAC T C C AC AGAG TC TG GC C T C A- C C TCC C TAC TGTC AGTC C T GT 3610 

III III III II I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 301 GC C CCAGAACATATGGGAC TCC AG AGCACCTGGCCTCACCCTCTC TAC TGTC AGTC CTGC 360 

Qy 3611 AGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTT 3670 

I I I I I I I I I I I I I I I I I II I I I II I I I I I II I I I I I I I I I I I I 

Db 361 AGAATCAGCCTCTGCTTGCTTGTGTACCCTGAGGTGCCCTCTCACTTTTTCCTTCAGGTT 420 

Qy 3671 TTCAGGGGACAGGCCAACCCAGAGGAC AGGAT T C C C T GGAGGC C AC A 3717 

I I I I I I I I I I I I I ill II II I I I I I II I I I I I I I I I 

Db 421 C TC AGGGGAC AGGC T GAC C AGGAT C AC C AGGAAGC T C C AGAGGATC C C C AGGAGGC C C TA 480 

Qy 3718 GAGGAGC AC C - AAGGAGAAG AT C T GT AAG TAGGC C T T T GT T AGAGTC T C C AAGGT T C AGT 3776 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GAGGAGC AC C AAAGG AGAAGAT C T GT AAGT AAGC C T T TGT T AGAGC C T C C AAGG T T CAGT 540 

Qy 3777 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 3836 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TTTTAGCTGAGGCTTCTCACATGCTCCCTCTCTCTCCAGGCCAGTGGGTCTCCATTGCCC 600 

Qy 3837 AGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGA 3896 

I I I I I I I I I I I I I I I I I I I II I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AGCTCCTGCCCACACTCCTGCCTGTTGCGGTGACCAGAGTCGTCATGTCTCTTGAGCAGA 660 

Qy 3897 GGAGTC T GC AC T GCAAGC C T GAGGAAGC C C T T GAGGC C C AAC AAGAGGC C C T GGGC C T GG 3956 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 661 AGAGTC AGC AC T GCAAGC C T GAGGAAGGCC T T GAC AC CC AAGAAGA- GC C C T GGGC C T GG 719 

Qy 3957 TGT GTGT GC AGGC TGCC AC CTCCTCCTCCTCTCCTCTGG 3995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 720 TGGGTGTGCAGGCTGCCACTACTGAGGAGCAGGAGGCTGTGTCCTCCTCCTCTCCTCTGG 779 

Qy 3996 TCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTC 4055 

III MINIUM I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I II 
Db 780 TCCCAGGCACCCTGGGGGAGGTGCCTGCTGCTGGGTCACCAGGTCCTCTCAAGAGTCCTC 839 

Qy 4056 AGGGAGC CTCCGCCTTTCC C AC TAC CAT C AAC T T C AC TCGAC AG AGGC AAC C C AGT GAGG 4115 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I t I I III I III 
Db 840 AGGGAGCCTCCGCCATCCCCACTGCCATCGATTTCACTCTATGGAGGCAATCCATTAAGG 899 

Qy 4116 GTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC 4175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 900 GC T C C AGC AAC C AAGAAGAGGAGG GGC C AAGC AC C T C C CC T GAC C C AGAGT C TGTGTTCC 959 

Qy 4176 GAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAG 4235 

I I I I I I I III I I I I I I I I I I I I I I I III II I I I I I I I I I I II I I I III II 
Db 960 GAGC AGC AC TC AGT AAGAAGG T GGC TGAC T T GAT TC AT TTTCTGCTCCT C AAG TAT T AAG 1019 

Qy 4236 C C AGGGAGC C AGTC AC AAAGGC AGAAAT GCTGGAGAG TGTC AT CAAAAAT TAC AAGC ACT 4295 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
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Db 1020 TC AAGGAGC C GGT C AC AAAGGC AGAAAT GC TGGAGAGC GT C ATC AAAAAT T AC AAGC GC T 1079 

Qy 4296 GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 4355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1080 GCTTTCCTGAGATCTTCGGCAAAGCCTCCGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 1139 

Qy 4356 T GAAGGAAGC AGACC C C AC C GGC C AC T C C TAT GTCCTTGT C AC C T GC C T AGG TCTCTCCT 4 415 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I II I I II Ml II 
Db 1140 TGAAGGAAGC GGAC C CC AC C AGC AAC AC C T AC AC C C T TGT C AC C TGCC TGGG AC T C - - C T 1197 

Qy 4416 AT GATGGC C T GC T GGGT GATAATC AGAT C ATG C C C AAGAC AGGC T TC C T GAT AAT TGT C C 4 475 

I I I M I I I I I I III I I I I I I I I I I I I I I I I I I I II I III I I I I I I I I I I III 
Db 1198 ATGATGGC C T GGTGG T T — TAAT C AGAT C ATGC C C AAGAC GGGC C TC C T GAT AATC G TC T 1255 

Qy 44 76 TGGTCAT GAT TGCAATGGAGGGCGGCCATGCT C C TGAGGAGGAAATC T GGGAGGAGC TGA 4 535 

III I I I I I I I I II I II I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1256 TGGGC AT GAT T GC AATGGAGGGC AAATGCGTC CC TGAGGAGAAAATC T GGGAGGAGC TGG 1315 

Qy 4536 GTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGC 4595 

MINIM | | | | | | | | | I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M 
Db 1316 G T G T GAT GAAGGT GT AT GT TGGGAGGGAGC AC AGT GT C T G TGGGGAGC C C AGGAAGC T GC 1375 

Qy 4 596 TC AC C C AAGAT T T GG TGC AGGAAAAGTAC C T GGAGT AC GGCAGG TGCC GGAC AGT GAT C C 4 655 

I I I I I I I I I I I I I I I I I I I M I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 137 6 TC AC C C AAGAT T T GG TGC AGGAAAAC TAC C T GGAGT AC CGC AGG TGC C C AGC AGT GAT C C 1435 

Qy 4656 CGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGT 4715 

I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1436 CAT AT GC TAT G AGT TAC TGT GGGG T C C AAGGGC AC T C GC T GC TTGAAAGT 1485 

Qy 4716 CCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTGA 4775 

II III I III III I I I I I I I I I I I I I I I I I Ml II II I I I II II II Ml 
Db 1486 ACTGGAGCACGTGGTCAGGGTCAATGCAAGAGTTCTCATTTCCTACCCATCCCTGCATGA 1545 

Qy 4776 AGC AGC T T T GAGAGAGGAGGAAGAGGGAGTC T GAGC AT GAGT T GC AGC C AAGGC C AGTGG 4835 

II I II I I I M I I I I I I I II II I I I I II I M I I I II I I II I I II I I I I I I I I I I I II 

Db 1546 AGC AGC T T T GAGAGAGGAGGAAGAGGGAGTC T GAGC AT GAGC T GC AGC C AGGGC C AC TGC 1605 

Qy 4836 GAGGGGG AC TGGGCCAGTGCACCTTCC AGGGC CGCGTCCAGCAGCTTCCCCTGCC-TCGT 4894 

II I I I I I I I I I I II II II I II II I I II I I I I I I I I II I II I I I I I II I I I I I 
Db 1606 GAGGGGGGCTGGGCCAGTGCACCTTCCAGGGCTCCGTCCAGTAGTTTCCCCTGCCTTAAT 1665 

Qy 4895 GTGACATGAGGCCCATTCTTCACTC — T G AAG AGAGC GG T C AGT G T T C T C AG TAG T AGGT 4952 

I I I I I I I I II I I I I I II II I I Ml I II I I II I I I II I I II II I I I I I I III 

Db 1666 GTGACATGAGGCCCATTCTTCTCTCTTTGAAGAGAGCAGTCAACATTCTTAGTAGTGGGT 172 5 

Qy 4953 TTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATG 5012 

II I I I I I I II I I I I II I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I II I I I I 

Db 1726 TTCTGTTCTATTGGATGACTTTGAGATTTGTCTTTGTTTCCTTTTGGAATTGTTCAAATG 1785 

Qy 5013 TTTTTTTT TAAGGGATGGT T GAAT GAAC T T C AGC AT C C AAGT T TAT GAATGAC AGC AGTC 5072 

II II I I II II I II I I I I I I I I I I II I I II I I I I I I I I I II I I II I I I I I I I I 
Db 1786 -TTCCTTT TAATGGGTGG T T GAAT GAAC T T C AGC AT T C AAAT T TAT GAATGAC AG T AGT C 1844 

Qy 5073 ACAC — AGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGA 5130 

I I I I III I I II I II I I I I I I II I I I I I I I I I II I I I I I II II I II II II I I I I 
Db 1845 AC AC AT AG TGC TGT T TAT AT AGT T TAGGAGT AAGAGT C T T GT T T T T TAT T C AGAT T GGGA 1904 

Qy 5131 AATCCATTCTATTTTGTGAATTGGG — AT AAT AAC AGC AG T GGAAT AAGT AC T T A- GAAA 5187 

I I I I II I II I I II I II II I I I I I I III I I I I I II I I I I I I II I II I I I I 
Db 1905 AAT C C AT TC C AT T T T GTGAATTGGGAC AT AGT TAC AGC AG T GGAAT AAGT AT TC AT T TAG 1964 
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Qy 5188 T GT GAAAAATGAGC AGT AAAAT AG AT GAGAT AAAGAAC T AAAGAAAT T AAGAGAT AG TC A 5247 

I 1 I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1965 AAATGTGAATGAGCAGTAAAAC TGATGAGA T AAAGAAAT T AAAAGAT AT T T A 2016 

Qy 5248 ATTCTTGCCTTATACCTCAGTCTATTCTGTAAAA--TTTTTAAAGATATATGCATACCTG 5305 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2017 ATTCTTGCCTTATA-CTCAGTCTATTCGGTAAAATTTTTTTTTAAAAATGTGCATACCTG 2075 

Qy 5306 GAT T T C C T TGGC T TC T T T GAGAAT GTAAGAGAAAT T AAAT C TGAAT AAAGAAT TC T T CC T 5365 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I Mill III 

Db 2076 GAT T T C C T TGGC T TC T T TGAGAAT GT AAGAC AAAT T AAAT C TGAATAAATC AT T C T C CC T 2135 

Qy 5366 GTTCACTGGCTCTTTTCTTCTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCTGGGTT 5425 

I I I I I I I I I I I I III I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2136 GTTCACTGGCTCATTTATTCTCTATGCACTGAGCATTTGCTCTGTGGAAGGCCCTGGGTT 2195 

Qy 5426 AGT AGT GGAGATGC T AAGG T AAGC C AGAC T CAT AC C C AC C C AT AGGGT CGT AGAGT C TAG 5485 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I 
Db 2196 AATAGTGGAGATGC TAAGGT AAGC C AGAC TCACCCC TACCC AC AGGGT AGT AAAGTC TAG 2255 

Qy 548 6 GAGCTGCAGTCACGTAATCGAGGTGGCAAGATGTCCTCTAA 552 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2256 GAGCAGCAGTCATATAATTAAGGTGGAGAGATGCCCTCTAA 22 96 

RESULT 11 
US-11-253-240-16 

Sequence 16, Application US/11253240 
Publication No. US20060127356A1 
GENERAL INFORMATION: 

APPLICANT: Gaugler, Batrice; Van den Eynde, BenoEt; 

van der Bruggen, Pierre; Boon-Falleur , Thierry 
TITLE OF INVENTION: Isolated Nucleic Acid Molecules Coding For 

Tumor Rejection Antigen Precursor Mage-3 And Uses Thereof 
NUMBER OF SEQUENCES: 30 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 
STREET: 805 Third Avenue 
CITY: New York City 
STATE: New York 
ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 
COMPUTER: IBM 
OPERATING SYSTEM: PC-DOS 
SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/11/253,24 0 
FILING DATE: 17-Oct-2005 
CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/09/579,543 
FILING DATE: 26-May-2000 
APPLICATION NUMBER: 09/583,850 
FILING DATE: 

APPLICATION NUMBER: PCT/US92/04 354 
FILING DATE: 22-MAY-1992 
APPLICATION NUMBER: 07/807,043 
FILING DATE: 12-DECEMBER-1991 
APPLICATION NUMBER: 07/764,365 


http://es/ScoreAccessWeb/GetItem^ 8/30/06 


FILING DATE: 2 3-SEPTEMBER-1991 
APPLICATION NUMBER: 07/728,838 
FILING DATE: 9-JULY-1991 
APPLICATION NUMBER: 07/705,702 
FILING DATE: 23-MAY-1991 
ATTORNEY/AGENT INFORMATION: 
NAME: Hanson, Norman D. 
REGISTRATION NUMBER: 30,946 
REFERENCE/DOCKET NUMBER: LUD 5353 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (212) 688-9200 
TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 16: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 2226 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: single 
TOPOLOGY: linear 
MOLECULE TYPE: genomic DNA 
FEATURE : 

NAME/KEY: MAGE- 5 gene 
SEQUENCE DESCRIPTION: SEQ ID NO: 16: 
US-11-253-240-16 

Query Match 24.9%; Score 1410.8; DB 8; Length 2226; 

Best Local Similarity 81.4%; Pred. No. 0; 

Matches 1874; Conservative 0; Mismatches 312; Indels 116; Gaps 16; 

Qy 3256 GGAT C C AGGC C C T GC C AGGAAAAAT ATAAGGGC C C T GC G T GAGAAC AGAGGGGGTC ATC C 3315 

I I I I I I II I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I III I 

Db 1 GGATCCAGGCCTTGCCAGGAGAAAGGTGAGGGCCCTGTGTGAGCACAGAGGGGACCATTC 60 

Qy 3316 AC T GC AT GAGAGT GGGGAT GTC AC AGAG T C C AGC C C AC C C T C C T GGT AGC AC TGAGAAGC 3375 

II II III I I I I II I I I I I I I I I I I I I I MINIMI I I I I II I I I I 

Db 61 AC C C C AAGAGGGTGGAGAC C TC AC AGAT TC CAGC C T AC CCTCCTGT T AGC AC TGGGGGC C 120 

Qy 3376 CAGGGCTGTGCTTGCGGTCTGCACCCTGAGGGCCCGTGGATTCCTCTTCCTGGAGCTCCA 3435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 121 TGAGGCTGTGCTTGCAGTCTGCACCCTGAGGGCCCATGCATTCCTCTTCCAGGAGCTCCA 180 

Qy 3436 GGAAC C AGGC AGT GAGGC C T TGGT C TGAGACAG TAT C C TC AGGT C AC AGAGC AGAGGATG 3495 

I I I I III II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I 
Db 181 GGAAAC AGAC AC T GAGGC C T TGGT C TGAGGCC GT GC C C TC AGG T C AC AGAGC AGAGGAGA 240 

Qy 34 96 CACAG GGTGTGCCAGCAGTGAATGTTTGCCCTGAATGCACACCAAGGGCCCCACCT 3551 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 241 TGCAGACGTCTAGTGCCAGCAGTGAACGTTTGCCTTGAATGCACACTAATGGCCCCCATC 300 

Qy 3552 GCCACAGGACACATAGGACTCCACAGAGTCTGGCCTCA-CCTCCCTACTGTCAGTCCTGT 3610 

III III III II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 GCCCCAGAACATATGGGACTCCAGAGCACCTGGCCTCACCCTCTCTACTGTCAGTCCTGC 360 

Qy 3611 AGAATCGACCTCTGCTGGCCGGCTGTACCCTGAGTACCCTCTCACTTCCTCCTTCAGGTT 3670 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AGAATCAGCCTCTGCTTGCTTGTGTACCCTGAGGTGCCCTCTCACTTTTTCCTTCAGGTT 420 

Qy 3671 TTCAGGGGACAGGCCAACCCAGAGGAC AGGAT TCCC TGGAGGCC ACA 3717 

I I I I I II I II I I I III II II I I I I I I I I I I I I I I I I 

Db 421 C TC AGGGGAC AGGC T GAC C AGGAT C AC C AGGAAGC T C C AG AGGAT C C C C AGG AGGC C C TA 480 

Qy 3718 GAGGAGC ACC - AAGGAGAAGATC TGTAAGTAGGCC T T TGT TAGAGTC TC CAAGGTTC AGT 3776 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 481 GAGGAGC ACC AAAGGAGAAGAT C T GT AAG T AAGC C T T T GT T AGAGC C T CC AAGGT T C AGT 540 

Qy 3777 TCTCAGCTGAGGCCTCTCACACACTCCCTCTCTCCCCAGGCCTGTGGGTCTTCATTGCCC 3836 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 541 TTTTAGCTGAGGCTTCTCACATGCTCCCTCTCTCTCCAGGCCAGTGGGTCTCCATTGCCC 600 

Qy 3837 AGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAGTCATCATGTCTCTTGAGCAGA 3896 

I I I I I I I I I I I I I I I I I I I I I I I I III I I II I I I I I I II I I I I I I I I I I I I I I I I 
Db 601 AGCTCCTGCCCACACTCCTGCCTGTTGCGGTGACCAGAGTCGTCATGTCTCTTGAGCAGA 660 

Qy 3897 GGAGTCTGCACTGCAAGCCTGAGGAAGCCCTTGAGGCCCAACAAGAGGCCCTGGGCCTGG 3956 

I I I I I I I I I I I I II I I I I I I I I I I 
Db 661 AGAGTCAGCAC TGCAAGCC TGAGGAA 68 6 

Qy 3957 TGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGG 4016 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 687 CTCCTCTGGTCCCAGGCACCCTGGGGGAGG 716 

Qy 4017 TGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCA 4076 

I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MM 

Db 717 TGCCTGCTGCTGGGTCACCAGGTCCTCTCAAGAGTCCTCAGGGAGCCTCCGCCATCCCCA 776 

Qy 4077 C T AC CAT C AAC T T C AC T C G AC AG AGGC AAC C C AGT G AGGG T TC C AGC AGC C G T GAAGAGG 4136 

II I I I I I I II I I I I I I I I I II M III I I I I I I II I II I II II II I II 

Db 777 C TGC CAT C GAT T TC AC T C TAT GGAGGC AAT CC AT T AAGGGC T C C AGC AAC C AAGAAGAGG 836 

Qy 4137 AGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGG 4196 

I I I I I I I I II I II II I I II II I I I I I I I M M I I I I I III I I I I I I M 

Db 837 AGGGGCC AAGC AC C T C C C C T GACC C AGAGT C TGTGTTCC GAGC AGC AC T C AG T AAGAAGG 896 

Qy 4197 TGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAGCCAGGGAGCCAGTCACAAAGG 4256 

II I I I I I III II I II I II II II II I I I III II II I I II I I I I I I I II I I 

Db 897 TGGCTGACTTGATTCATTTTCTGCTCCTCAAGTATTAAGTCAAGGAGCTGGTCACAAAGG 956 

Qy 4257 CAGAAAT GC TGGAGAGTGT CATCAAAAATTACAAGC AC TGT TT T CC TGAGATC T TC GGCA 4316 

I II I I I I I I II I I II I II I I I I I I I M I I I I II II III I I I I II I I I I I II II I II I 
Db 957 CAGAAAT GC TGGAGAGC GT CAT C AAAAATTAC AAGC GCTGCTTTCCT GAGATC T TC GGC A 1016 

Qy 4317 AAGC C TC T GAG T C C T T GC AGC T GG T C T T TGGC AT T GAC GT GAAGGAAGC AGAC C CC ACC G 4376 

I I IE I I I II I II II II I I I I I I I I II II II I I I I I I I II II II I I II I IE I I I I I I I 

Db 1017 AAGC C TC C GAG T C C T T GC AGC TGG T C T T TGGC AT T GAC G T GAAGGAAG C GGAC C CC ACC A 107 6 

Qy 4377 GCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTG 4433 

M II I I I I I I II I I I I I I I II M II I I I I I II I II I I I I I II I I I II 
Db 1077 GCAACACCTACACCCTTGTCACCTGCCTGGG — ACTCCTATGATGGCCTGCTGGTTGATA 1134 

Qy 4 434 ATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGG 44 93 

II I I I I I I II I I I I II II I I I I III I I II I I I I I I Ml Ml I I II I I I II I M II 

Db 1135 ATAATCAGATCATGCCCAAGACGGGCCTCCTGATAATCGTCTTGGGCATGATTGCAATGG 1194 

Qy 4 494 AGGGC GGC CAT GC TC C TGAGGAGG AAAT C T GGGAGGAGC T GAGT G T GATGGAGGTG TATG 4 553 

Mill I I I I I I I I I I I I I II M I I II I II II I II I I I II I I I I II II I I I 

Db 1195 AGGGC AAAT GC GTC C C T GAGGAGAAAAT C T GGGAGGAGC T GAGT G T GATGAAGG TG TATG 1254 

Qy 4 554 ATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGC 4 613 

I I I I I I II I I I I I I M I II I I I I I II M I I I I I I I I II I M I I II I I I I I II I II II 
Db 1255 TTGGGAGGGAGCACAGTGTCTGTGGGGAGCCCAGGAAGCTGCTCACCCAAGATTTGGTGC 1314 

Qy 4 614 AGGAAAAGTAC C TGG AGT A- C GGC AGG T GC C GGAC AG T GAT C C C GC AC G C TAT GAGT T C C 4 672 

I I M II I I I M I I I I I I I I I II I II M I I I I II I I I II I I I I I I II I I M I 
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Db 1315 AGGAAAAC TAC C TGG AGT ACC GGC AGGT GC C C AGC AGTGAT C C C AT AT GC TAT GAG T T AC 1374 

Qy 4 673 TGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAGTCCTTGAGTATGTGATCA 4732 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I III III 

Db 1375 TGTGGGGTCCAAGGGCACTCGCTG CTTGAAAGTACTGGAGCACGTGGTCA 1424 

Qy 4733 AGG T C AG TGC AAGAG TTCGCTTTTTCT T CC C ATC C C TGC GT GAAGC AGC T T T GAGAGAGG 4792 

I I I I I I I I I I I I I I I I I III II I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1425 GGG TCAATGC AAGAG T TC T C AT TT C C TACC C ATC C C T GC G T GAAGC AGC T T T GAGAGAGG 1484 

Qy 4793 AGGAAGAGGGAGTCTGAGCATGAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAG 4852 

I I I I I I I I I I II I I I i I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I 
Db 1485 AGGAAGAGGGAGTCTGAGCATGAGCTGCAGCCAGGGCCAC TGCGAGGGGGGC TGGGCCAG 1544 

Qy 4853 TGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCC-TCGTGTGACATGAGGCCCATT 4911 

I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 1545 TGCACCTTCCAGGGCTCCGTCCAGTAGTTTCCCCTGCCTTAATGTGACATGAGGCCCATT 1604 

Qy 4912 CTTCACTC — TGAAGAGAGCGGTCAGTGTTC TC AGT AGT AGGT TTC TGTTC TATTGGGTG 4969 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1605 CTTCTCTCTTTGAAGAGAGCAGTCAACATTCTTAGTAGTGGGTTTCTGTTCTATTGGATG 1664 

Qy 4 970 ACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATG 502 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 1665 ACTTTGAGATTTGTCTTTGTTTCCTTTTGGAATTGTTCAAATGTTTC-TTTTAATGGGTG 1723 

Qy 5030 GTTGAATGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTCACAC--AGTTCTGTGTA 5087 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I III I I I I II 
Db 1724 G T T GAAT GAAC T T C AGCAT T C AAAT T TATGAAT GAC AGT AGT C AC AC AT AGT GC TG T T T A 1783 

Qy 5088 TAT AGT T TAAGGGT AAGAG TCTTGTGTTT TAT T C AGAT T GGGAAATCC AT T C TAT T T T GT 5147 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1784 TATAGTTTAGGAGTAAGAGTCTTGTTTTTTATTCAGATTGGGAAATCCATTCCATTTTGT 1843 

Qy 5148 GAAT T GGG — ATAAT AACAGCAGTGGAATAAGTAC T TA- GAAAT GTGAAAAATGAGCAGT 5204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1844 GAATTGGGACATAGT TACAGCAGTGGAATAAGTATTCATT TAGAAATGTGAATGAGCAGT 1903 

Qy 5205 AAAAT AG AT GAGAT AAAG AAC T AAAGAAAT T AAGAG AT AG T C AAT T C T T GC C T TAT AC C T 52 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1904 AAAAC T GAT GAC A T AAAGAAAT TAAAAGAT AT TT AAT TCTTGCTTATACTC A 1955 

Qy 5265 C AG TC TAT T C T GTAAAAT T T T T AAAGAT ATAT GC AT ACC T GGAT T TC C T T GGC T T C T T TG 5324 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1956 GTCTATTCGGTAAAATTTTTTTTAAAAAATGTGCATACCTGGATTTCCTTGGCTTCTTTG 2015 

Qy 5325 AGAAT GT AAGAG AAAT TAAAT C TGAAT AAAGAAT TC TTCCTGTT C AC TGGCTCTTTTCTT 5384 

I I I I I I I I I I 1 I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I III II 

Db 2016 AGAAT GTAAGAC AAAT TAAAT C TGAAT AAAT CAT TC TCCCTGTT C AC T GGC T CAT T TAT T 2075 

Qy 5385 CTCCATGCACTGAGCATCTGCTTTTTGGAAGGCCCTGGGTTAGTAGTGGAGATGCTAAGG 54 4 4 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I f I I I 

Db 2076 CTCTATGCACTGAGCATTTGCTCTGTGGAAGGCCCTGGGTTAATAGTGGAGATGCTAAGG 2135 

Qy 5445 TAAGCCAGACTCATACCCACCCATAGGGTCGTAGAGTCTAGGAGCTGCAGTCACGTAATC 5504 

I I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 
Db 2136 T AAGC C AGAC T C AC C C C T ACC C AC AGGG T AGT AAAG T C T AGGAGC AGC AGTC AT AT AAT T 2195 

Qy 5505 GAGGTGGCAAGATGTCCTCTAA 5526 

I I I I I I I I I I I I I I I I I I 
Db 2196 AAGGTGGAGAGATGCCCTCTAA 2217 
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RESULT 12 

US-11-266-748A-87851 

; Sequence 87851, Application US/11266748A 

; Publication No. US20060134663A1 

; GENERAL INFORMATION: 

; APPLICANT: Harkin, Paul 

APPLICANT: Johnston, Patrick 
; APPLICANT: Mulligan, Karl 

TITLE OF INVENTION: Transcriptome Microarray Technology and 

TITLE OF INVENTION: Methods of Using the Same 
; FILE REFERENCE: 55815-0102 (319189) 
; CURRENT APPLICATION NUMBER: US/11/2 66, 748A 
; CURRENT FILING DATE: 2005-11-03 
; PRIOR APPLICATION NUMBER: EP 04105479.2 
; PRIOR FILING DATE: 2004-11-03 
; PRIOR APPLICATION NUMBER: EP 041054 82.6 
; PRIOR FILING DATE: 2004-11-03 
; PRIOR APPLICATION NUMBER: EP 041054 83.4 
; PRIOR FILING DATE: 2004-11-03 
; PRIOR APPLICATION NUMBER : EP 04105507.0 
; PRIOR FILING DATE: 2004-11-03 
; PRIOR APPLICATION NUMBER: EP 04105485.9 
; PRIOR FILING DATE: 2004-11-03 , 
; PRIOR APPLICATION NUMBER: EP 04105484.2 
; PRIOR FILING DATE: 2004-11-03 
; PRIOB APPLICATION NUMBER: US 60/662,27 6 
; PRIOR FILING DATE: 2005-03-14 
; PRIOR APPLICATION NUMBER: US 60/700,293 
/ PRIOR FILING DATE: 2005-07-18 
; NUMBER OF SEQ ID NOS : 483996 

SOFTWARE: Patentln version 3.3 
; SEQ ID NO 87851 
LENGTH: 1577 
TYPE: DNA 

ORGANISM: Homo Sapiens 
US-11-266-748A-87851 

Query Match 20.9%; Score 1188.2; DB 8; Length 1577; 

Best Local Similarity 89.4%; Pred. No. 4.1e-299; 
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Qy 3816 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 3875 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 40 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGTTGCCCTGACGAGAG 99 

Qy 387 6 TCATCATGTC T C T TGAGCAGAGGAGTC T GCAC TGCAAGCC TGAGGAAGCCC T TGAGGC CC 3935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 100 TC ATC AT GT C T C T TGAGCAGAGGAGTC T GCAC T GC AAGC C TGAGGAAGC C C T TGAGGC C C 159 

Qy 3936 AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGG 3995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I 
Db 160 AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCGCCTCCTCCTCCTCTCCTCTGG 219 

Qy 3996 TC C TGGGC AC C C T GGAGGAGGTGC C C AC TGC T GGGT C AAC AGAT C C TC C CC AGAG T C C T C 4055 

I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I 
Db 220 TCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTC 27 9 

Qy 4056 AGGGAGC CTCCGCCTTTCC C AC TAC CAT C AAC T TC AC TC GAC AG AGGC AAC C C AGT GAGG 4115 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
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Db 280 AGGGAGC CTCCGCCTTTCC CAC T AC CAT C AAC T TC AC T C AAC AGAGGC AAC C C AG T GAGG 339 

Qy 4116 GTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC 4175 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 340 GTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC 399 

Qy 4176 GAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAG 4235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 400 GAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAG 4 59 

Qy 4236 CCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGTCATCAAAAATTACAAGCACT 4295 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I 

Db 4 60 C C AGGGAGC C AGT C AC AAAGGCAGAAAT GC TGGAGAGTGT CAT C AAAAAT TAC AAGC AC T 519 

Qy 4296 GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 4355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 520 GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 579 

Qy 4 356 TGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCT 4415 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 580 T GAAGGAAGC AGAC C C CAC C GGCC AC T C C TAT GTCCTTGT CAC C T GC C T AGGTC TC T CC T 639 

Qy 4 416 ATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCC 447 5 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I II 

Db 640 ATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCC 699 

Qy 4476 T GG T CAT GAT T GC AAT GGAGGGC G GC C AT GC T C C T GAGGAGGAAAT C T GGGAGGAGC TGA 4535 

I I I I I I I I I I I I I I I MINIMI Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 700 T GG TC AT GAT C GC AATAGAGGGCG GC T G T GCC C C TGAGGAGGAAAT C T GGGAGGAGC T GA 759 

Qy 4 536 GTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGC 4595 

II II I I I I I I I I I I I I I I I I I MM II I I I I II I I I I I I I I I I I I I I I 

Db 7 60 GTATGTTGGAGGTGTATGAGGGGAAGGAGGACAGTGTCTTCGCACATCCCAGGAAGCTGC 819 

Qy 4596 TC AC CC AAGAT T T GG T GC AGGAAAAG TAC C TGGAGT A- C GGC AGGT G C C GG AC AG T GAT C 4654 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 820 TCATGCAAGATCTGGTGCAGGAAAACTACCTGGAGTACCGGCAGGTGCCGGGCAGTGATC 879 

Qy 4655 CCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAG 4714 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 880 CTGCATGCTACGAGTTCCTGTGGGGTCCAAGGGCCCTCATTGAAACCAGCTATGTGAAAG 939 

Qy 4715 TCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTG 4774 

I I I I I II I I I I I I I II I I I I I II I I I I I II I I I I I I I I 

Db 940 T C C T GC AC C AT ACAC T AAAGAT CGG TGAAGAAC C T CAC AT T T C C TACC CAC C C C T GC AT G 999 

Qy 4775 AAGCAGC TTTGAGAGAGGAGGAAGAGGGAGTC TGAGCATGAGTTGCAGCCAAGGCC AGTG 4834 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1000 AACGGGC TTTGAGAGAGGGAGAAGAGTGAGTC TCAGCACAAGTTGCAGCCAAGGCCAGTG 1059 

Qy 4835 GGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGT 4894 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I 

Db 1060 GGAGGGGGACTGGGCCAGTGCACCTTCCAGGGACCCATCCAGCAACTTCCACTGCCTCGA 1119 

Qy 4895 GT GAC AT GAGGC CC AT TC T T — CAC TC T GAAGAGAGC GGT C AG T G T T C T C AGT AG T AGG T 4952 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II III II 

Db 1120 GT G AC AT GAGGCCC AT TCCTGCCTCTTT GAAGAGAGC AGT C AGC AT TC T T AGC AG T GAGT 1179 

Qy 4 953 TTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATG 5012 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I II I I I I I I I I I I I I I I I I I 

Db 1180 TTCTGTTCTGTTGGATGACTTTGAGATTTATCTTTGTTTCCTGTTGGAATTGTTCAAATG 1239 
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Qy 

Db 


5013 TTTTTTTT T AAGGGAT GGT TGAAT GAAC T TC AGC AT C C AAGT T TAT GAATGAC AGC AGTC 5072 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1240 TTCC-TTT TAAC AAAT GGT T GG ATGAAC TT C AGC AT C C AAGT T TAT GAATGAC AG TAGT C 1298 


Qy 5073 ACAC--AGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGA 5130 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I II 
Db 1299 AC AC ATAGT GC T GT T T ATATAGT T TAGGGGT AAGAG TCCTGTTTTT TAT T C AGATT GGGA 1358 

Qy 5131 AATCCAT TC TATT TT GTGAAT TG — GGATAATAACAGCAGTGGAAT AAGT ACT TAGAAAT 5188 

I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I 111 II II 

Db 1359 AATCCAT TCCATTTTGTGAGTTGTCACATAATAACAGCAGTGGAATATGTATTTGCC TAT 1418 

Qy 5189 GT GAAAAATGAGCAGTAAAATAGATGAGATAAAGAACTAAAGAAATTAAGAGATAG 5244 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1419 AT T GTGAAC GAAT TAGC AG TAAAATAC ATGAT AC AAGGAAC T C AAAAGAT AG 1470 

Qy 5245 T C AAT TC T T GC C T TAT AC C T C AG T C TAT TC T GTAAAAT T T T T AAAGAT AT AT GC AT ACC T 5304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1471 TTAATTCTTGCCTTATACCTCAGTCTATTATGTAAAA TTAAAAATATGTGTA 1522 

Qy 5305 GGAT T TC C T TGGC T T C T T T GAGAAT G TAAGAGAAAT TAAATC TGAAT AAAGAAT T 5359 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1523 TGT T T T TGC T T C T T T GAGAAT GC AAAAG AAAT TAAATC T AGG T AGG T AAT T 1573 
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US-11-266-748A-112460 


Query Match 20.9%; Score 1188.2; DB 8; Length 1577; 

Best Local Similarity 89.4%; Pred. No. 4.1e-299; 

Matches 1390; Conservative 0; Mismatches 133; Indels 32; Gaps 9; 

Qy 3816 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 3875 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 40 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGTTGCCCTGACGAGAG 99 

Qy 3876 TC ATC AT GTC T C T T GAGC AGAGGAGTC T GC AC TGC AAGC C T GAGGAAGC C C T T GAGGC C C 3935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 100 T CAT CAT GT C T C T T GAGCAGAGGAGT C T GC AC T GC AAGC C TGAG GAAGC C C T TGAGGC C C 159 

Qy 3936 AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGG 3995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 160 AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCGCCTCCTCCTCCTCTCCTCTGG 219 

Qy 3996 T C C TGGGC AC C C T GGAGGAGGT GC C CAC T GC T GGGT C AAC AG AT C C TC C C C AGAGT C C TC 4055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 220 TC C TGGGC AC C C T GGAGGAGGT GC C CAC T GC T GGGT C AAC AG AT C C TC C C C AGAGT C C TC 279 

Qy 4056 AGGGAGC C TC C GC C T T T C C CAC TAC CAT C AAC T TC AC T CGAC AGAGGC AAC C C AGT GAGG 4115 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 280 AGGGAGC C T C C GC C T T T C C CAC TAC CAT CAAC T T CAC T C AAC AGAGGC AAC C C AGT GAGG 339 

Qy 4116 GTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC 4175 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I i I I I I I I I I I I I I I I I 
Db 340 GTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC 399 

Qy 4176 GAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAG 4235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 400 GAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAG 459 

Qy 4236 C C AGGGAGC C AGT C AC AAAGGCAGAAATGCTGGAGAGT GTC ATC AAAAAT TAC AAGC ACT 4295 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 60 C C AGGGAGC CAGT C AC AAAGGC AGAAAT GC T GGAGAGT GT C AT C AAAAAT T AC AAG CAC T 519 

Qy 4296 GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 4355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 520 GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 57 9 

Qy 4356 TGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCT 4415 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 580 TGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCT 639 

Qy 4416 ATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCC 4475 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 640 ATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCC 699 

Qy 4476 T GG T CAT GAT T GC AAT GGAGGGC GGCC AT GC T C C T GAGGAGGAAAT C T GGGAGGAG C TGA 4535 

I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I II I I I I I I I I I I II I I I I 
Db 700 TGG T CAT GATC GC AAT AGAGGGC GGC TGTGCCCCT GAGGAGGAAAT CT GGGAGGAGC TGA 759 

Qy 4 536 GTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGC 4595 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 60 G T AT GT T GGAGGTGT AT GAGGGGAAGGAGGAC AGT G T C T T C GC AC ATC C C AG GAAG C TGC 819 

Qy 4 596 TC AC C C AAGAT T TGG T GCAGGAAAAGTAC C TGGAGT A- CGGC AGG T GC C GG AC AGT GAT C 4 654 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 820 TCATGCAAGATCTGGTGCAGGAAAACTACCTGGAGTACCGGCAGGTGCCGGGCAGTGATC 879 
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Qy 4 655 CCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAG 4714 

I Ell I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I II 
Db 880 CTGCATGCTACGAGTTCCTGTGGGGTCCAAGGGCCCTCATTGAAACCAGCTATGTGAAAG 939 

Qy 4715 TCCTTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCTTCCCATCCCTGCGTG 4774 

I I I I E II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 940 TCCTGCACCATACACTAAAGATCGGTGAAGAACCTCACATTTCCTACCCACCCCTGCATG 999 

Qy 4775 AAGCAGC TTTGAGAGAGGAGGAAGAGGGAGTC TGAGCATGAGTT GCAGCCAAGGCC AGTG 4834 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1000 AAC GGGC TTTGAGAGAGGGAGAAGAGTGAGTC TCAGCACAAGTT GCAGCCAAGGC C AGTG 1059 

Qy 4835 GGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGT 4894 

I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1060 GGAGGGGGACTGGGCCAGTGCACCTTCCAGGGACCCATCCAGCAACTTCCACTGCCTCGA 1119 

Qy 4895 GTGAC AT GAGGC C CAT T C T T — C AC TC T GAAGAGAGC GG TC AG TGT T C TC AGTAG T AGGT 4 952 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II III II 
Db 1120 GTGAC AT GAGGC C CAT TC C TGC C T C T T T GAAGAGAGC AGT CAGC AT T C TT AGC AGT GAGT 1179 

Qy 4 953 TTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATG 5012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1180 TTCTGTTCTGTTGGATGACTTTGAGATTTATCTTTGTTTCCTGTTGGAATTGTTCAAATG 1239 

Qy 5013 TTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCAAGTTTATGAATGACAGCAGTC 5072 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1240 TTCC-TTT T AAC AAAT GG T T GGAT GAAC T T CAGC AT C C AAGT T TAT GAAT GAC AG T AGT C 12 98 

Qy 5073 ACAC — AGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGA 5130 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I ME I I I I I I I I I I I I I I I I I 
Db 1299 ACACATAGTGCTGTTTATATAGTTTAGGGGTAAGAGTCCTGTTTTTTATTCAGATTGGGA 1358 

Qy 5131 AATCCATTCTATTTTGTGAATTG — GGATAATAAC AGC AGT GGAAT AAGT AC T T AGAAAT 5188 

I I I I I I I I I I I I I I I I I I III I I I I I II I I I I I I I I I I I I I III II II 

Db 1359 AAT C C AT T C CAT T T T GT GAG T TGT C AC ATAAT AAC AGC AG T GGAAT AT GTAT T TGC C TAT 1418 

Qy 5189 GT GAAAAATGAGC AGTAAAAT AGATGAGAT AAAGAAC T AAAGAAAT T AAGAGATAG 524 4 

I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1419 AT T GT GAAC GAAT TAGC AG TAAAATAC ATGAT AC AAGGAAC T C AAAAGAT AG 1470 

Qy 524 5 T C AAT T C T T GC C T TATAC C TC AGT C TAT TC T G T AAAAT T T T T AAAGAT AT ATGC AT AC C T 5304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1471 TTAATTCTTGCCTTATACCTCAGTCTAT TATGTAAAA T T AAAAAT AT G TG T A 1522 

Qy 5305 GGAT TTCCTTGGCTTCTTT GAGAAT G TAAG AG A/VAT T AAATC T G AAT AAAG AAT T 5359 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1523 T GT T T TTGC T T C T T T GAGAAT GCAAAAGAAAT T AAATC T AGG TAGG TAAT T 1573 


RESULT 14 

US-11-2 66-748A-140662/C 

; Sequence 140662, Application US/11266748A 

; Publication No. US20060134663A1 

; GENERAL INFORMATION: 

; APPLICANT: Harkin, Paul 

APPLICANT: Johnston, Patrick 
; APPLICANT: Mulligan, Karl 

TITLE OF INVENTION: Transcriptome Microarray Technology and 
; TITLE OF INVENTION: Methods of Using the Same 
; FILE REFERENCE: 55815-0102 (319189) 
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; NUMBER OF SEQ ID NOS : 483996 

SOFTWARE: Patentln version 3.3 
; SEQ ID NO 140662 
LENGTH: 1577 
TYPE: DNA 
; ORGANISM: Homo Sapiens 
US-11-266-748A-140662 

Query Match 20.9%; Score 1188.2; DB 8; Length 1577; 

Best Local Similarity 89.4%; Pred. No. 4.1e-299; 

Matches 1390; Conservative 0; Mismatches 133; Indels 32; Gaps 9; 

Qy 3816 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 3875 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IE I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1538 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGTTGCCCTGACGAGAG 1479 

Qy 387 6 TC AT CAT G T C T C T T GAGC AGAGGAGT C T GC AC T GC AAGC C TGAGGAAGC C CTT GAGGC C C 3935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I 
Db 1478 TC AT C AT GT C T C T T GAGC AGAGGAGT C T GC AC T GC AAGC C TGAGGAAGC C CTT GAGGC C C 1419 

Qy 3936 AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCACCTCCTCCTCCTCTCCTCTGG 3995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
Db 1418 AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCTGCCGCCTCCTCCTCCTCTCCTCTGG 1359 

Qy 3996 TCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTC 4055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1358 TCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAACAGATCCTCCCCAGAGTCCTC 1299 

Qy 4056 AGGGAGC CTCCGCCTTTCC C AC T ACC AT C AAC T TC AC TC GAC AGAGGC AAC C C AGT GAGG 4115 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1298 AGGGAGC C TCC GCC T T TCC CAC TACC AT CAAC T TCAC TCAAC AGAGGC AAC C C AGT GAGG 1239 

Qy 4116 GTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC 4175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1238 GTTCCAGCAGCCGTGAAGAGGAGGGGCCAAGCACCTCTTGTATCCTGGAGTCCTTGTTCC 1179 

Qy 4176 GAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAG 4235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I 
Db 1178 GAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTTTTCTGCTCCTCAAATATCGAG 1119 

Qy 4236 CCAGGGAGCCAGTCACAAAGGCAGAAATGCTGGAGAGTGTCATCAAAAATTACAAGCACT 4295 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1118 C C AGGGAGC C AGT CAC AAAGGC AG AAAT GC T GGAGAG TGT C ATC AAAAAT T AC AAG CAC T 1059 
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Qy 4296 GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 4355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1058 GTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGCAGCTGGTCTTTGGCATTGACG 999 

Qy 4 356 TGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCT 4 415 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
Db 998 TGAAGGAAGCAGACCCCACCGGCCACTCCTATGTCCTTGTCACCTGCCTAGGTCTCTCCT 939 

Qy 4 416 ATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCC 4475 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I 
Db 938 ATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGACAGGCTTCCTGATAATTGTCC 879 

Qy 4476 TGGTCATGAT TGCAATGGAGGGCGGCCATGC TCC TGAGGAGGAAATC TGGGAGGAGC TGA 4535 

I I I I I I I I I I II I I I I I IE I I I I I III I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 878 T GG T CAT GAT C GCAAT AGAGGGCGGC T G TGC CC C TGAGGAGGAAATC T GGGAGGAGC TGA 819 

Qy 4536 GTGTGATGGAGGTGTATGATGGGAGGGAGCACAGTGCCTATGGGGAGCCCAGGAAGCTGC 4 595 

It II I I I II I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 818 GTATGTTGGAGGTGTATGAGGGGAAGGAGGACAGTGTCTTCGCACATCCCAGGAAGCTGC 759 

Qy 4 596 TCACCCAAGATTTGGTGCAGGAAAAGTACCTGGAGTA-CGGCAGGTGCCGGACAGTGATC 4 654 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 758 TCATGCAAGATCTGGTGCAGGAAAACTACCTGGAGTACCGGCAGGTGCCGGGCAGTGATC 699 

Qy 4655 CCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCGCTGAAACCAGCTATGTGAAAG 4714 

I III I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 698 CTGCATGCTACGAGTTCCTGTGGGGTCCAAGGGCCCTCATTGAAACCAGCTATGTGAAAG 639 

Qy 4715 TCC TTGAGTATGTGATCAAGGTCAGTGCAAGAGTTCGCTTTTTCT TCC CATC CCTGCGTG 4774 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 638 TCC T GC AC CAT AC AC T AAAGAT C G GTGAAGAAC C TC AC AT TTC C T AC C C AC C C C T GC AT G 57 9 

Qy 4775 AAGC AGC T T T GAGAGAGGAGGAAGAGGGAGT C TGAGC AT GAGT T GC AG C C AAGGC C AGT G 4834 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 578 AAC GGGC T T T GAGAG AGGG AGAAGAGT GAGT C T C AGC AC AAGT T GC AGC C AAGGC C AGTG 519 

Qy 4835 GGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTCCAGCAGCTTCCCCTGCCTCGT 4894 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 518 GGAGGGG GAC T GGGC C AGT GC AC C T TC C AGGGAC CC ATC C AGC AAC TTC C AC T GC C TC GA 459 

Qy 4895 GTGACATGAGGCCCATTCTT — C AC TC T GAAGAGAGC GG TC AG T GT T C T C AGT AG T AGGT 4952 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I II III II 
Db 458 GT GAC AT GAGGC C CAT TCCTGCCTCTTT GAAGAGAGC AGT C AGC AT TC T T AGC AGT GAGT 399 

Qy 4 953 TTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTCTCTTTTGGAATTGTTCAAATG 5012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 398 TTCTGTTCTGTTGGATGACTTTGAGATTTATCTTTGTTTCCTGTTGGAATTGTTCAAATG 339 

Qy 5013 TTTTTTTT TAAGGGAT GG T T GAAT GAAC T TC AGC AT C C AAGT T T ATGAATGAC AGC AGT C 5072 

II I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 338 TTCC-TTT TAAC AAAT GG T T GG AT GAAC TT C AGC AT C C AAGT T T ATGAATGAC AG T AGT C 280 

Qy 5073 ACAC — AGTTCTGTGTATATAGTTTAAGGGTAAGAGTCTTGTGTTTTATTCAGATTGGGA 5130 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 
Db 279 AC AC AT AG TGC TGT T TAT AT AGT T T AGGGGT AAGAG TCCTGTTTTT TAT T CAGAT T GGGA 220 

Qy 5131 AATCCATTCTATTTTGTGAATTG — GGATAATAACAGC AGTGGAAT AAGT AC T T AGAAAT 5188 

I I I I I I I I I 1 I I I I I I I I Ell I I I I I I I I I I I I I I I I I I I I III II II 

Db 219 AATCCATTCCATTTTGTGAGTTGTCACATAATAACAGCAGTGGAATATGTATTTGCCTAT 160 
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Qy 5189 GT GAAAAATGAGCAGTAAAATAGATGAGATAAAGAACTAAAGAAATTAAGAGATAG 5244 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t 

Db 159 AT T GTGAAC GAAT T AGC AGTAAAATACATGAT AC AAGGAAC T C AAAAGAT AG 108 

Qy 524 5 TCAATTCTTGCCTTATACCTCAGTCTATTCTGTAAAATTTTTAAAGATATATGCATACCT 5304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 107 TTAATTCTTGCCTTATACCTCAGTCTATTATGTAAAA TTAAAAATATGTGTA 56 

Qy 5305 GGATT T CCTTGGCTTCTTT GAGAAT GT AAGAGAAAT T AAATC TGAATAAAGAAT T 5359 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 55 TGTTTTTGCTTCTTT GAGAAT GCAAAAGAAAT T AAATC TAGG TAGG TAAT T 5 
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SEQUENCE CHARACTERISTICS: 

LENGTH: 1640 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA to mRNA 
FEATURE : 

NAME/KEY: cDNA MAGE- 3 
SEQUENCE DESCRIPTION: SEQ ID NO: 11: 
US-11-253-240-11 

Query Match 17.4%; Score 988.8; DB 8; Length 1640; 

Best Local Similarity 81.5%; Pred. No. 4.4e-247; 

Matches 1253; Conservative 0; Mismatches 2 52; Indels 33; Gaps 8; 
Qy 3816 GCCTGTGGGTCTTCATTGCCCAGCTCCTGCCCACACTCCTGCCTGCTGCCCTGACGAGAG 3875 

III I I I I I I I I I M I I I I I I ! I I II I I I I I I I II I I I I I I I I I I I I I I I I I INI 

Db 107 GCCAGTGGGTCTCCATTGCCCAGCTCCTGCCCACACTCCCGCCTGTTGCCCTGACCAGAG 166 

Qy 387 6 T CAT CAT GT C T C T T GAGC AGAGGAGTC T GC AC T GC AAGC C T GAGGAAGC C C T T GAGGCC C 3935 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 167 T CAT CAT GC C T C T T G AGC AGAGGAGT C AGC AC T GC AAGC C T GAAGAAGGC C T T GAG GC C C 226 

Qy 3936 AACAAGAGGCCCTGGGCCTGGTGTGTGTGCAGGCT GCCA 3974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 227 GAGGAGAGGCCCTGGGCCTGGTGGGTGCGCAGGCTCCTGCTACTGAGGAGCAGGAGGCTG 28 6 

Qy 3975 CCTCCTCCTCCTCTCCTCTGGTCCTGGGCACCCTGGAGGAGGTGCCCACTGCTGGGTCAA 4034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 287 CCTCCTCCTCTTCTACTCTAGTTGAAGTCACCCTGGGGGAGGTGCCTGCTGCCGAGTCAC 346 

Qy 4035 CAGATCCTCCCCAGAGTCCTCAGGGAGCCTCCGCCTTTCCCACTACCATCAACTTCACTC 4094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I II I I I I I I I I Ml 
Db 347 C AGAT C C T C C C C AGAGTC C T C AGGGAGC C T C C AGC C T C C C C AC T AC C ATGAAC TAC C C T C 406 

Qy 4095 GAC AGAGGC AAC C C AG TGAGGG T T C C AGC AGC C GTG AAGAGGAGGGGC C AAGC ACC TC T T 4154 

III III II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 
Db 407 TC T GGAGC C AATC C T ATGAGGAC T C C AGC AAC CAAG AAGAGGAGGGGC C AAGC AC C T TC C 4 66 

Qy 4155 GTATCCTGGAGTCCTTGTTCCGAGCAGTAATCACTAAGAAGGTGGCTGATTTGGTTGGTT 4214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 467 CTGACCTGGAGTCCGAGTTCCAAGCAGCACTCAGTAGGAAGGTGGCCGAGTTGGTTCATT 52 6 

Qy 4215 TTCTGCTCC T CAAATATC GAGC C AGGGAGC C AGT C AC AAAGGC AGAAATGC TGGAGAGT G 4274 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 527 TTCTGCTCCTCAAGTATCGAGCCAGGGAGCCGGTCACAAAGGCAGAAATGCTGGGGAGTG 586 

Qy 4275 TCATCAAAAATTACAAGCACTGTTTTCCTGAGATCTTCGGCAAAGCCTCTGAGTCCTTGC 4334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 587 TCGTCGGAAATTGGCAGTATTTCTTTCCTGTGATCTTCAGCAAAGCTTCCAGTTCCTTGC 64 6 

Qy 4 335 AGC T GGT C T T T GGC AT T G AC GT GAAGGAAGC AGAC C C C AC C GGC C AC T C C T AT GT C C T TG 4394 

I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I II II III 
Db 647 AGCTGGTCTTTGGCATCGAGCTGATGGAAGTGGACCCCATCGGCCACTTGTACATCTTTG 706 

Qy 4395 TCACCTGCCTAGGTCTCTCCTATGATGGCCTGCTGGGTGATAATCAGATCATGCCCAAGA 4454 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I M 
Db 707 CCACCTGCCTGGGCCTCTCCTACGATGGCCTGCTGGGTGACAATCAGATCATGCCCAAGG 7 66 

Qy 4455 CAGGCTTCCTGATAATTGTCCTGGTCATGATTGCAATGGAGGGCGGCCATGCTCCTGAGG 4514 

I I I I I I I I I I I I I I I I I I I I I I III II I I I I I I I I II I I III I I I II I I 
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Db 767 CAGGCCTCCTGATAATCGTCCTGGCCATAATCGCAAGAGAGGGCGACTGTGCCCCTGAGG 826 

Qy 4515 AGGAAAT C TGGGAGG AGC T GAGTG T GAT GGAGGTGT AT GATGGGAGGGAGC AC AGT GCC T 4574 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I 

Db 827 AGAAAAT C T GGGAGG AGC T GAGT G TGT T AGAGGT GT T T GAGGGGAGGGAAGAC AGT ATGT 88 6 

Qy 4575 ATGGGGAGC C C AGGAAGC T GC TC AC CC AAGAT T T GG T GC AGGAAAAGT AC C T GGAG T A- C 4633 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 887 TGGGGGAT C C C AAGAAGC T GC TC AC CC AAC AT T TC G TGC AGGAAAAC T AC C TGGAG T AC C 94 6 

Qy 4 634 GGCAGGTGCCGGACAGTGATCCCGCACGCTATGAGTTCCTGTGGGGTCCAAGGGCCCTCG 4 693 

I I I I I I I II I I I I I I I I I I III I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 947 GGCAGGTCCCCGGCAGTGATCCTGCATGTTATGAATTCCTGTGGGGTCCAAGGGCCCTCG 1006 

Qy 4694 C T GAAAC C AGC T AT GTGAAAGT CC T TGAGTAT GT GATC AAGGT C AGT GC AAGAGT T C GC T 4753 

I I I I I I I I I I I I I I I I I I I I I I I I II II I Ml I I I I I I I II II I 

Db 1007 T T GAAAC C AGC TAT G TGAAAG T CC TGC AC C AT AT GG TAAAGAT C AGT GGAGGAC C T C AC A 1066 

Qy 4754 TTTTCTTCC C ATC CC TGC G TGAAGC AGC T T TGAGAG AGGAGGAAGAGGGAGT C T GAGC AT 4813 

III II I I I I I I I I I I III I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1067 T T T C C TAC C C AC C C C TGC ATGAGT GGGT T T TGAGAGAGGGGGAAGAGT GAGT C T GAGCAC 1126 

Qy 4814 GAGTTGCAGCCAAGGCCAGTGGGAGGGGGACTGGGCCAGTGCACCTTCCAGGGCCGCGTC 4873 

II I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I II 

Db 1127 GAGTTGCAGCCAGGGCCAGTGGGAGGGGGTCTGGGCCAGTGCACCTTCCGGGGCCGCATC 1186 

Qy 4874 CAGCAGCTTCCCCTGCCTCGTGTGACATGAGGCCCATTCTTCACTC — TGAAGAGAGCGG 4931 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1187 CC T TAGTTTCC AC TGCCTCCTGTGACGTGAGGCCCATTCTTC AC TCTT TGAAGC GAGCAG 1246 

Qy 4932 TCAGTGTTCTCAGTAGTAGGTTTCTGTTCTATTGGGTGACTTGGAGATTTATCTTTGTTC 4991 

I I I I I I I I I I I I I I I I I I I I I M I II I I II I I I I I I I I I I I I I I I I I I I I 
Db 1247 TCAGCATTCTTAGTAGTGGGTTTCTGTTCTGTTGGATGACTTTGAGATTATTCTTTGTTT 1306 

Qy 4992 TCTTTTGGAATTGTTCAAATGTTTTTTTTTAAGGGATGGTTGAATGAACTTCAGCATCCA 5051 

II I I I I I I I II I I I I M I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1307 CCTGTTGGAGTTGTTCAAATG-TTCCTTTTAACGGATGGTTGAATGAGCGTCAGCATCCA 1365 

Qy 5052 AGTTTATGAATGACAGCAGTCACAC — AGTTCTGTGTATATAGTTTAAGGGTAAGAGTCT 5109 

I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1366 GGTTTATGAATGACAGTAGTCACACATAGTGCTGTTTATATAGTTTAGGAGTAAGAGTCT 1425 

Qy 5110 TGTGTTTTATTCAGATTGGGAAATCCATTCTATTTTGTGAATTGGG— ATAATAACAGCA 5167 

III I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1426 TGTTTTTTACTCAAATTGGGAAATCCATTCCATTTTGTGAATTGTGACATAATAATAGCA 1485 

Qy 5168 GT GGAAT AAG T AC T T - AGAAATGT G AAAAAT GAGCAG T AAAAT AGATGAGAT AAAGAAC T 522 6 

I I I I I I I I I I II II I I II II III I I I I I I 

Db 1486 GT GGT AAAAGT AT T T GC T T AAAAT T GTGAGC GAAT T AGC AAT AAC AT AC AT GAG AT AAC T 154 5 

Qy 5227 AAAGAAAT T AAGAGAT AGT C AAT T C T TGCC T TAT AC C TC AGTC TAT TC TGT AAAAT T T T T 5286 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 154 6 C AAGAAAT C AAAAGAT AGT T GAT TCTTGCCTT GT AC C T C AAT C TAT TC TGT AAAA TT 1602 

Qy 5287 AAAGATAT AT GC AT AC C T GGAT T T C C T T GGC T TC T T T G 5324 

III I I I I I I I I III I II I I I I I I I I I I I I I I I I 
Db 1603 AAAC AAAT AT GC AAAC C AGGAT T T C C T T GAC T TC T T T G 1640 
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